વેબને કેપ્ચર અને કન્વર્ટ કરવા માટેનાં સાધનો

વેબસાઇટમાંથી લિંક્સ કાractો

આ ઉદાહરણ એ તરીકે પણ ઉપલબ્ધ છે નમૂનો.

એક સામાન્ય કાર્ય વેબસાઇટમાંથી લિંક્સ કા extવાનું છે, ખાસ કરીને એચટીએમએલ લિંક્સ. સદનસીબે ઉપયોગ કરતી વખતે આ સરળ છે GrabzIt ની વેબ સ્ક્રેપર. સૌ પ્રથમ સામાન્ય વિગતો સાથે નવી સ્ક્રેપ બનાવો જેમ કે સ્ક્રેપના પ્રારંભિક પૃષ્ઠ અને અન્ય કોઈપણ વિકલ્પો.

પછી પર જાઓ સ્ક્રેપ સૂચનાઓ ટેબ અને ક્લિક કરો વેબ પૃષ્ઠ બટન બટન આ દાખલ કરશે Page શબ્દ intઓ સ્ક્રેપ સૂચનો અને એક ડ્રોપ ડાઉન ખુલશે. પસંદ કરો getTagAttributes સૂચિમાંથી. આગળ ઉમેરો 'href' પ્રથમ પરિમાણ તરીકે, આ વેબ સ્ક્રેપરને href લક્ષણ કાractવા કહે છે, પછી અલ્પવિરામ લખો.

આગળ ક્લિક કરો ફિલ્ટર બટન આ તમને વેબ સ્ક્રેપરને કહેવાની મંજૂરી આપે છે કે href એટ્રિબ્યુટ કયા તત્વોમાંથી કાractવા છે. ફિલ્ટર વિંડોમાં ખાતરી કરો કે 'વેબ પેજ' પર પ્રકાર સુયોજિત છે અને પ્રતિબંધ 'ટ tagગ નામ' અને 'બરાબર' છે. પછી દાખલ કરો a ટેક્સ્ટ બ inક્સમાં અને પછી એડ બટનને ક્લિક કરો અને પછી ફિલ્ટર બટન શામેલ કરો. લાઇનના અંતમાં અર્ધ-કોલોન ઉમેરીને સૂચનાને સમાપ્ત કરો.

નીચે જેવું બતાવવામાં આવ્યું છે તેવું કંઈક છોડવું જોઈએ.

Page.getTagAttributes('href', {"tag":{"equals":"a"}});

ઉપરોક્ત કોડ વેબ પૃષ્ઠમાંથી બધા લિંક URL ને કાractશે, પરંતુ હવે આપણને આની જરૂર છે save તે લિંક URL ની. આ કરવા માટે, આપણે આ આદેશને બાદબાકી કરીશું Data.save આદેશ. આ કરવા માટે, લાઇનના પ્રારંભમાં જાઓ અને પસંદ કરો ડેટા બટન બટન પછી ડ્રોપ ડાઉન પસંદ કરો save, પછી લીટીના અંતમાં જાઓ અને અલ્પવિરામ ઉમેરો. પછી તમે જેને 'મારી વેબસાઇટ' તરીકે ડેટાસેટ પર ક toલ કરવા માંગો છો તે ઉમેરો, પછી બીજી અલ્પવિરામ ઉમેરો અને પછી 'લિંક્સ' જેવા સ્તંભનું વર્ણન કરવા માટે અન્ય પરિમાણો ઉમેરો, પછી આદેશને એક સાથે બંધ કરો ) અર્ધ-કોલોન પહેલાં.

તમારી પાસે હવે નીચેની સ્ક્રેપ સૂચનાઓ હોવી જોઈએ.

Data.save(Page.getTagAttributes('href', {"tag":{"equals":"a"}}), 'My Websites', 'Links');

હવે જો તમે સ્ક્રેપ ચલાવો છો તો તમે વેબસાઇટથી બધી લિંક્સ કા .ી શકો છો. આ મારી વેબસાઈટ્સના નામ સાથે, લિંક્સના ક columnલમ નામ સાથે એક ટેબલ બનાવશે જે પછી નિકાસ કરી શકાય છે intઘણા XML, CSV અથવા સ્પ્રેડશીટ જેવા વિવિધ બંધારણો. આ ટ્યુટોરીયલ પણ સ્ક્રેપ સૂચના ટૂલબારમાં વિઝાર્ડ બટનનો ઉપયોગ કરીને પ્રાપ્ત કરી શકાય છે.