એક સામાન્ય કાર્ય વેબસાઇટમાંથી લિંક્સ કા extવાનું છે, ખાસ કરીને એચટીએમએલ લિંક્સ. સદનસીબે ઉપયોગ કરતી વખતે આ સરળ છે GrabzIt ની વેબ સ્ક્રેપર. સૌ પ્રથમ સામાન્ય વિગતો સાથે નવી સ્ક્રેપ બનાવો જેમ કે સ્ક્રેપના પ્રારંભિક પૃષ્ઠ અને અન્ય કોઈપણ વિકલ્પો.
પછી પર જાઓ સ્ક્રેપ સૂચનાઓ ટેબ અને ક્લિક કરો બટન આ દાખલ કરશે
Page
શબ્દ intઓ સ્ક્રેપ સૂચનો અને એક ડ્રોપ ડાઉન ખુલશે. પસંદ કરો getTagAttributes
સૂચિમાંથી. આગળ ઉમેરો 'href'
પ્રથમ પરિમાણ તરીકે, આ વેબ સ્ક્રેપરને href લક્ષણ કાractવા કહે છે, પછી અલ્પવિરામ લખો.
આગળ ક્લિક કરો આ તમને વેબ સ્ક્રેપરને કહેવાની મંજૂરી આપે છે કે href એટ્રિબ્યુટ કયા તત્વોમાંથી કાractવા છે. ફિલ્ટર વિંડોમાં ખાતરી કરો કે 'વેબ પેજ' પર પ્રકાર સુયોજિત છે અને પ્રતિબંધ 'ટ tagગ નામ' અને 'બરાબર' છે. પછી દાખલ કરો
a
ટેક્સ્ટ બ inક્સમાં અને પછી એડ બટનને ક્લિક કરો અને પછી ફિલ્ટર બટન શામેલ કરો. લાઇનના અંતમાં અર્ધ-કોલોન ઉમેરીને સૂચનાને સમાપ્ત કરો.
નીચે જેવું બતાવવામાં આવ્યું છે તેવું કંઈક છોડવું જોઈએ.
Page.getTagAttributes('href', {"tag":{"equals":"a"}});
ઉપરોક્ત કોડ વેબ પૃષ્ઠમાંથી બધા લિંક URL ને કાractશે, પરંતુ હવે આપણને આની જરૂર છે save તે લિંક URL ની. આ કરવા માટે, આપણે આ આદેશને બાદબાકી કરીશું Data.save
આદેશ. આ કરવા માટે, લાઇનના પ્રારંભમાં જાઓ અને પસંદ કરો બટન પછી ડ્રોપ ડાઉન પસંદ કરો
save
, પછી લીટીના અંતમાં જાઓ અને અલ્પવિરામ ઉમેરો. પછી તમે જેને 'મારી વેબસાઇટ' તરીકે ડેટાસેટ પર ક toલ કરવા માંગો છો તે ઉમેરો, પછી બીજી અલ્પવિરામ ઉમેરો અને પછી 'લિંક્સ' જેવા સ્તંભનું વર્ણન કરવા માટે અન્ય પરિમાણો ઉમેરો, પછી આદેશને એક સાથે બંધ કરો )
અર્ધ-કોલોન પહેલાં.
તમારી પાસે હવે નીચેની સ્ક્રેપ સૂચનાઓ હોવી જોઈએ.
Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');
હવે જો તમે સ્ક્રેપ ચલાવો છો તો તમે વેબસાઇટથી બધી લિંક્સ કા .ી શકો છો. આ મારી વેબસાઈટ્સના નામ સાથે, લિંક્સના ક columnલમ નામ સાથે એક ટેબલ બનાવશે જે પછી નિકાસ કરી શકાય છે intઘણા XML, CSV અથવા સ્પ્રેડશીટ જેવા વિવિધ બંધારણો. આ ટ્યુટોરીયલ પણ સ્ક્રેપ સૂચના ટૂલબારમાં વિઝાર્ડ બટનનો ઉપયોગ કરીને પ્રાપ્ત કરી શકાય છે.