એક સામાન્ય કાર્ય વેબસાઇટમાંથી લિંક્સ કા extવાનું છે, ખાસ કરીને એચટીએમએલ લિંક્સ. સદનસીબે ઉપયોગ કરતી વખતે આ સરળ છે GrabzIt ની વેબ સ્ક્રેપર. સૌ પ્રથમ સામાન્ય વિગતો સાથે નવી સ્ક્રેપ બનાવો જેમ કે સ્ક્રેપના પ્રારંભિક પૃષ્ઠ અને અન્ય કોઈપણ વિકલ્પો.
પછી પર જાઓ સ્ક્રેપ સૂચનાઓ ટેબ અને ક્લિક કરો બટન આ દાખલ કરશે Page શબ્દ intઓ સ્ક્રેપ સૂચનો અને એક ડ્રોપ ડાઉન ખુલશે. પસંદ કરો getTagAttributes સૂચિમાંથી. આગળ ઉમેરો 'href' પ્રથમ પરિમાણ તરીકે, આ વેબ સ્ક્રેપરને href લક્ષણ કાractવા કહે છે, પછી અલ્પવિરામ લખો.
Page
getTagAttributes
'href'
આગળ ક્લિક કરો આ તમને વેબ સ્ક્રેપરને કહેવાની મંજૂરી આપે છે કે href એટ્રિબ્યુટ કયા તત્વોમાંથી કાractવા છે. ફિલ્ટર વિંડોમાં ખાતરી કરો કે 'વેબ પેજ' પર પ્રકાર સુયોજિત છે અને પ્રતિબંધ 'ટ tagગ નામ' અને 'બરાબર' છે. પછી દાખલ કરો a ટેક્સ્ટ બ inક્સમાં અને પછી એડ બટનને ક્લિક કરો અને પછી ફિલ્ટર બટન શામેલ કરો. લાઇનના અંતમાં અર્ધ-કોલોન ઉમેરીને સૂચનાને સમાપ્ત કરો.
a
નીચે જેવું બતાવવામાં આવ્યું છે તેવું કંઈક છોડવું જોઈએ.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
ઉપરોક્ત કોડ વેબ પૃષ્ઠમાંથી બધા લિંક URL ને કાractશે, પરંતુ હવે આપણને આની જરૂર છે save તે લિંક URL ની. આ કરવા માટે, આપણે આ આદેશને બાદબાકી કરીશું Data.save આદેશ. આ કરવા માટે, લાઇનના પ્રારંભમાં જાઓ અને પસંદ કરો બટન પછી ડ્રોપ ડાઉન પસંદ કરો save, પછી લીટીના અંતમાં જાઓ અને અલ્પવિરામ ઉમેરો. પછી તમે જેને 'મારી વેબસાઇટ' તરીકે ડેટાસેટ પર ક toલ કરવા માંગો છો તે ઉમેરો, પછી બીજી અલ્પવિરામ ઉમેરો અને પછી 'લિંક્સ' જેવા સ્તંભનું વર્ણન કરવા માટે અન્ય પરિમાણો ઉમેરો, પછી આદેશને એક સાથે બંધ કરો ) અર્ધ-કોલોન પહેલાં.
Data.save
save
)
તમારી પાસે હવે નીચેની સ્ક્રેપ સૂચનાઓ હોવી જોઈએ.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
હવે જો તમે સ્ક્રેપ ચલાવો છો તો તમે વેબસાઇટથી બધી લિંક્સ કા .ી શકો છો. આ મારી વેબસાઈટ્સના નામ સાથે, લિંક્સના ક columnલમ નામ સાથે એક ટેબલ બનાવશે જે પછી નિકાસ કરી શકાય છે intઘણા XML, CSV અથવા સ્પ્રેડશીટ જેવા વિવિધ બંધારણો. આ ટ્યુટોરીયલ પણ સ્ક્રેપ સૂચના ટૂલબારમાં વિઝાર્ડ બટનનો ઉપયોગ કરીને પ્રાપ્ત કરી શકાય છે.