વેબને કેપ્ચર અને કન્વર્ટ કરવા માટેનાં સાધનો

ડેટાસેટને કેવી રીતે પેડ કરવું

ક્યારેક જ્યારે ડેટાસેટ બનાવવું માં વેબ સ્ક્રેપર વધુ કિંમતો ઉમેરવામાં આવે છે intઓ એક ક columnલમ બીજા કરતાં. નીચેનાં ઉદાહરણમાં પ્રથમ પૃષ્ઠને સ્ક્રેપ કર્યા પછી જહોન નામ નામના સ્તંભમાં ત્રણ રંગો સાથે ઉમેરવામાં આવ્યું છે અને પછીના પૃષ્ઠ પર ડેવિડ નામ બીજા બે રંગો સાથે ઉમેરવામાં આવ્યું છે. નીચેનો ડેટાસેટ આપવા માટે.

નામરંગ
જ્હોનપીળા
ડેવિડRed
ગ્રીન
બ્લુ
જાંબલી

જો કે આ કોષ્ટક ભ્રામક છે કારણ કે તે બતાવતું નથી કે કયા નામ સાથે કયા રંગ મળ્યાં છે. તેના બદલે pad બધી કોલમ સમાન લંબાઈ ન થાય ત્યાં સુધી ડેટાસેટ કumnsલમ્સના અંતમાં ખાલી કોષોને આપમેળે જોડવા માટે પદ્ધતિનો ઉપયોગ કરી શકાય છે. એક ઉદાહરણ pad ઉપયોગમાં લેવામાં આવતી પદ્ધતિ નીચે બતાવેલ છે.

Data.save(Page.getTagValue({"class":{"equals":"Name"}}), 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad();

આ સ્ક્રેપ સૂચનો ડેટાસેટ ઉત્પન્ન કરે છે જે આના જેવો દેખાય છે.

નામરંગ
જ્હોનપીળા
Red
ગ્રીન
ડેવિડબ્લુ
જાંબલી

અમે સ્પષ્ટ કરીને આને વધુ સુધારી શકીએ છીએ padValue ના પરિમાણ pad સ્ક્રેપર દ્વારા મળેલ નામની પદ્ધતિ. જેમ કે આ ઉદાહરણમાં ત્યાં પૃષ્ઠ પર ફક્ત એક જ નામ છે જે સ્ક્રેપ સૂચનો બને છે.

var name = Page.getTagValue({"class":{"equals":"Name"}});
Data.save(name, 'Name', 'Color');
Data.save(Page.getTagValues({"class":{"equals":"Color"}}), 'Name', 'Color');
Data.pad(name);

જે નીચે બતાવ્યા પ્રમાણે નામ ક columnલમના દરેક ખાલી સેલમાં નામ મૂકે છે.

નામરંગ
જ્હોનપીળા
જ્હોનRed
જ્હોનગ્રીન
ડેવિડબ્લુ
ડેવિડજાંબલી