વેબ સ્ક્રેપ બનાવવા માટે તમારે નીચેની ટsબ્સમાં ફેલાયેલી પાંચ પ્રકારની માહિતીનો ઉલ્લેખ કરવો પડશે.
નીચેની બધી સુવિધાઓ સ્ક્રેપ વિકલ્પો ટ tabબ પર વેબ સ્ક્રેપને કસ્ટમાઇઝ કરવા માટે ઉપલબ્ધ છે.
સ્ક્રેપ નામ સ્ક્રેપનું નામ.
લિંક્સ અનુસરો સ્ક્રેપર કડીઓ કેવી રીતે અનુસરે છે તે નીચેના વિકલ્પો પ્રદાન કરે છે:
ફાઇલ ડાઉનલોડ્સ અવગણો એકવાર કોઈપણ લિંક્સ સેટ કરો, જે મુલાકાત લીધેલ હોય ત્યારે ફાઇલ ડાઉનલોડ થવા માટેનું કારણ બને છે.
રોબોટ્સ.ટેક્સ ફાઇલને અવગણો જો સેટ કરેલું હોય તો સ્ક્રેપર વેબ પૃષ્ઠોની મુલાકાત લઈ શકે છે જે સામાન્ય રીતે વેબસાઇટ માલિક દ્વારા ક્રોલ કરવામાંથી બાકાત રાખવામાં આવે છે.
ભૂલ પૃષ્ઠોને અવગણો જો વેબ સ્ક્રેપર સેટ કરવામાં આવે તો તે કોઈપણ વેબ પૃષ્ઠોને છોડી દેશે જે ભૂલની જાણ કરે છે. તેથી કોઈપણ HTTP સ્ટેટસ કોડ 400 અથવા તેથી વધુ.
Ignore URL fragments if set the web scraper will ignore the part of the URL after the #
this feature is commonly used to denote a bookmark on the same page and so would normaly result in needless pages being scraped. However, some websites use this feature to show different content, in which case this setting needs to be disabled. This option is only applicable when follow links is not as required.
ડુપ્લિકેટ્સને અવગણો જો સેટ કરેલું હોય તો તે તમે સેટ કરેલી સમાનતા કરતા સમાન અથવા વધુ સમાન પૃષ્ઠોને અવગણશે, દાખલા તરીકે, તમે તે જ પૃષ્ઠોને અવગણશો જે 95% સમાન છે.
મર્યાદા સ્ક્રેપ અટકાવવા પહેલાં વેબ સ્ક્રેપરને કેટલા પૃષ્ઠોને સ્ક્રેપ કરવું જોઈએ તે નિર્દિષ્ટ કરવા દે છે.
મારો ટાઇમઝોન વાપરો જો સેટ કરેલું હોય તો તે સંકેત આપે છે કે વેબ સ્ક્રેપર દ્વારા કોઈપણ તારીખને ભંગાર કરવામાં તેને બદલવાનો પ્રયાસ કરવો જોઈએ intઓ તમારો સ્થાનિક સમય ઝોન. તમારું ટાઇમ ઝોન એકાઉન્ટ પૃષ્ઠ પર સેટ કરી શકાય છે.
સ્થાન ભૌગોલિક સ્થાન વેબ સ્ક્રેપરથી સ્ક્રેપ કરવામાં આવશે. જો લક્ષ્ય વેબસાઇટમાં સ્થાનના આધારે નિયંત્રણો હોય તો આ ઉપયોગી થઈ શકે છે.
ડિફોલ્ટ તારીખ ફોર્મેટ તારીખોને રૂપાંતરિત કરતી વખતે જ્યાં તારીખ ફોર્મેટ નક્કી કરી શકાતું નથી, વેબ સ્ક્રેપર તેના બદલે આ પસંદ કરેલા ફોર્મેટમાં ડિફ defaultલ્ટ થશે.
પૃષ્ઠ લોડ વિલંબ મિલિસેકન્ડમાં આ સમય છે વેબ સ્ક્રraપરે પૃષ્ઠને વિશ્લેષણ કરતા પહેલા રાહ જોવી જોઈએ. જો તે પૃષ્ઠમાં ખૂબ જ AJAX શામેલ હોય અથવા લોડ કરવામાં ધીમું હોય તો આ ખૂબ ઉપયોગી છે.
In the Target Website tab you specify websites you want to extract data from. To tell the scrape tool to extract data from a website you first have to specify the main URL you are intદા.ત. http://www.example.com/shop/
આ તે છે જે સ્ક્રેપર તેના સ્ક્રેપને પ્રારંભ કરશે, તે સામાન્ય વેબપેજ, પીડીએફ દસ્તાવેજ, એક્સએમએલ દસ્તાવેજ, જેએસઓન દસ્તાવેજ, આરએસએસ ફીડ અથવા સાઇટમેપ હોઈ શકે છે. જો તે વેબ પૃષ્ઠ અથવા પીડીએફ દસ્તાવેજ નથી, તો સ્ક્રેપર ફાઇલમાંની બધી લિંક્સ શોધી શકશે અને દરેકની મુલાકાત લેશે.
ફક્ત લક્ષ્ય URL માં મળેલી લિંક્સને અનુસરવા માટે અને પછીનાં કોઈપણ પૃષ્ઠોને તમે સેટ કરી શકશો નહીં લિંક્સ અનુસરો સ્ક્રેપ વિકલ્પ થી પ્રથમ પૃષ્ઠ પર. આ લક્ષ્ય URL નો ઉપયોગ ફક્ત બાકીના સ્ક્રેપને બીજ બનાવવા માટે કરશે.
ડિફ defaultલ્ટ રૂપે, વેબ સ્ક્રેપર તે મુલાકાત લેતી દરેક વેબ પૃષ્ઠ પર શોધેલી દરેક લિંકને અનુસરે છે. જો તમે પ્રતિબંધિત કરવા માંગતા હોવ તો આને કઇ લિંક કરે છે વેબ સ્ક્રેપર follows, one simple way to do this is to specify a URL Pattern. This powerful technique mainly works by specifying a URL with the asterisk as a wild card to denote that any characters can be present in this part of the pattern. For instance http://www.example.com/*/articles/*
વેબસાઇટના મૂળમાંથી બીજા ડિરેક્ટરી તરીકેના લેખો ધરાવતા કોઈપણ URL ને સ્ક્રેપ કરશે.
યુઆરએલ પેટર્નને નિર્ધારિત કરવાની વધુ પ્રતિબંધિત રીત એ વિકલ્પોની વ્યાખ્યા છે. દાખલા તરીકે આ ઉદાહરણ ફક્ત સ્ટોર અથવા સમાચાર સાથે મેળ ખાશે:
http://www.example.com/
/*
તેથી આ આ સાથે મેળ ખાશે http://www.example.com/store/products/1
પણ નહીં http://www.example.com/about/
.
અથવા વૈકલ્પિક રીતે કંઈક સિવાયની દરેક વસ્તુ સાથે મેળ ખાય તે શક્ય છે. દાખલા તરીકે આ ઉદાહરણ સ્ટોર અથવા સમાચાર સાથે મેળ ખાતું નથી:
http://www.example.com/
/*
તેથી આ આ સાથે મેળ ખાશે http://www.example.com/about/
પણ નહીં http://www.example.com/store/products/1
!
A URL pattern can also contain keywords. A keyword is anything contained in a double square brackets. So [[URL_START]]www.example.com*
will match against any valid start of a URL so http://www.example.com/
, https://www.example.com/
અથવા તો ftp://www.example.com/
દાખલા તરીકે.
બીજ URLs વપરાશકર્તાને URL ની સૂચિનો ઉલ્લેખ કરવાની મંજૂરી આપે છે જે વેબ સ્ક્રેપર દ્વારા ક્રોલ થવી આવશ્યક છે. જો તમે ફક્ત બીજ URL ને કાraી નાખવા માંગો છો લિંક્સ અનુસરો સ્ક્રેપ વિકલ્પો થી કોઈ પૃષ્ઠો સ્ક્રેપ વિકલ્પો ટ inબમાં.
To set Seed URLs on the Target Website tab, click the Add Target button then check the Set Seed URLs checkbox and specify each URL to scrape on a separate line.
વૈકલ્પિક રૂપે તમે નમૂના URL નો ઉપયોગ કરીને આપમેળે બીજ URL બનાવી શકો છો, આ એક સિંગલ URL છે જેમાં URL ચલ શામેલ છે. યુઆરએલ વેરીએબલ એ પુનરાવર્તિત થવાની સંખ્યાની શ્રેણીનો ઉલ્લેખ કરે છે.
પ્રારંભ નંબર એ તે સંખ્યા છે કે યુઆરએલ વેરીએબલની ગણતરી શરૂ થવી જોઈએ, સમાપ્તિ નંબર તે નંબર છે કે જે URL ચલ ગણતરી કરવાનું બંધ કરશે, પુનરાવર્તિત સંખ્યા તે સંખ્યા છે જે URL ચલના દરેક પુનરાવૃત્તિ માટે સંખ્યા વધારશે.
ઉદાહરણ તરીકે, નીચેના Templateાંચો URL માટે
http://www.example.com/search?pageNo=
તે પછી નીચેના બીજ URL બનાવશે:
યુઆરએલ દાખલા તરીકે લ aગિન ફોર્મ માટે પણ પોસ્ટ કરી શકે તેવા પરિમાણો સાથેનો URL પણ ઉલ્લેખિત કરી શકે છે. આમ કરવા માટે લક્ષ્ય URL ટેક્સ્ટ બ inક્સમાં ફોર્મ URL નો ઉલ્લેખ કરો અને વાપરવા માટે જરૂરી પોસ્ટ પરિમાણો ઉમેરો. પોસ્ટ વેરિયેબલ મૂલ્યોમાં વિશેષ ગ્રાબઝિટ ચલો શામેલ હોઈ શકે છે, જેમ કે:
- દિવસ બે અંકવાળા મૂલ્ય તરીકે
- બે અંકના મૂલ્ય તરીકેનો મહિનો
- વર્ષ ચાર અંકના મૂલ્ય તરીકે
- બે અંકના મૂલ્ય તરીકે કલાક
- બે અંકના મૂલ્ય તરીકે મિનિટ
- બે-અંકના મૂલ્ય તરીકે બીજું
સ્ક્રેપ સૂચનો વેબ સ્ક્રેપરને કહે છે કે લક્ષ્ય વેબસાઇટને સ્ક્રેપ કરતી વખતે કઇ ક્રિયાઓ કરવી જોઈએ. સ્ક્રેપ સૂચનાઓ ટ tabબ ડિફ defaultલ્ટ રૂપે સ્ક્રેપ વિઝાર્ડ બતાવે છે, જે તમને જરૂરી સ્ક્રેપ સૂચનોને ઉમેરવાનું સરળ બનાવે છે. આ વિઝાર્ડનો ઉપયોગ કરવાનું એક સારું ઉદાહરણ છે ઉત્પાદન સૂચિ અને વિગતવાર સ્ક્રેપિંગ ટ્યુટોરિયલ.
એકવાર તમે સ્ક્રેપ કરવાનું પ્રારંભ કરવા માટે તૈયાર છો નવી સ્ક્રેપ સૂચના ઉમેરો લિંક.
આ વિઝાર્ડ ખોલશે અને આપમેળે લક્ષ્ય URL ને લોડ કરશે, તમે જે કાraી નાખવા માંગો છો તે તરત જ પસંદ કરવાની મંજૂરી આપે છે. જો કોઈ વેબપેજ અથવા પીડીએફ દસ્તાવેજ લોડ થઈ ગયો હોય તો તમે કોઈપણ લિંક પર ક્લિક કરી શકો છો અને તે સામાન્ય તરીકે કાર્ય કરશે, ઉદાહરણ તરીકે બીજા વેબપૃષ્ઠ પર નેવિગેશન કરવા માટે. જ્યાં સુધી તમે એક ક્રિયા પસંદ ન કરો ત્યાં સુધી, સ્ક્રીનના તળિયે, આ પોint સામગ્રી પરના કોઈપણ ક્લિક્સ તમે કાractવા અથવા હેરાફેરી કરવા માંગો છો તે HTML ઘટક પસંદ કરશે.
સ્ક્રેપ સૂચનો વિશે સમજવાની પ્રથમ વસ્તુ એ છે કે તે મૂળભૂત રીતે દરેક વેબ પૃષ્ઠ પર ચલાવવામાં આવે છે. આને રોકવાની રીત એ નમૂનાઓનો ઉપયોગ છે. કોઈ લિંકને ક્લિક કરવા જેવી ક્રિયા કરતી વખતે નમૂનાને સોંપી શકાય છે, અને જેથી જ્યારે પણ સ્ક્રેપર તે લિંકની મુલાકાત લે અથવા તે બટનને ક્લિક કરે ત્યારે તે ઓળખી લેશે કે તે સોંપાયેલ નમૂનાનો છે. આ પૃષ્ઠના વિવિધ પ્રકારોને નિર્ધારિત કરવાની મંજૂરી આપે છે. હમણાં પૂરતું તમારી પાસે એક ઉત્પાદન કેટેગરી પૃષ્ઠ હોઈ શકે છે જેમાં કેટલીક વિહંગાવલોકન માહિતી અને પછી વિગતવાર પૃષ્ઠ છે જેમાં ઉત્પાદન માહિતી શામેલ છે. બંને પૃષ્ઠોને સંભવતra સ્ક્રેપ સૂચનોના અલગ સેટની જરૂર પડશે.
પ્રારંભ કરવા માટે પસંદ કરો ક્લિક કરો ક્રિયા, પછી તમે ક્રિયાઓ કરવા માંગો છો તે આઇટમ્સ પસંદ કર્યા પછી અને ક્લિક કરો આગળ બટન માં નમૂનાનું નામ દાખલ કરો એક Templateાંચો બનાવો ટેક્સ્ટ બ nowક્સ હવે જ્યારે પણ સ્ક્રેપર આ ક્રિયાઓ ચલાવે છે, ત્યારે આપેલું ટેમ્પલેટ તે નામ હશે જે તમે પ્રદાન કર્યું છે.
પછી કોઈ સ્ક્રેપ સૂચનાને ચોક્કસ નમૂના અસાઇન કરવા માટે તમારે. માંથી ઇચ્છિત નમૂના પસંદ કરવાની જરૂર છે માં ચલાવો ડ્રોપ ડાઉન સૂચિ, જે વિકલ્પો વિંડોમાં દેખાય છે જે સ્ક્રેપ સૂચના ઉમેરવામાં આવે તે પહેલાં જ દેખાય છે. નમૂના પસંદ કરતી વખતે ત્રણ મુખ્ય વિકલ્પો નીચે મુજબ છે:
એકવાર તમે આ વિકલ્પોમાંથી એક પસંદ કરી લો, સ્ક્રેપ સૂચના ફક્ત ઉલ્લેખિત નમૂના પર જ ચલાવવામાં આવશે.
તમે જોશો કે તમે જ્યારે પસંદ કરો છો ડેટા કા Extો ક્રિયા. સ્ક્રીનની નીચે ડાબી બાજુનો ખૂણો તમને ઉપરની વિંડોમાં HTML ઘટક પસંદ કરવા અથવા વૈશ્વિક પૃષ્ઠની મિલકત પસંદ કરવા માટે આમંત્રણ આપે છે.
વૈશ્વિક પૃષ્ઠની મિલકતનો ઉપયોગ કરવા માટે, ક્લિક કરો વૈશ્વિક પૃષ્ઠ સંપત્તિ કડી. પછી પુષ્ટિ કરો કે તમે ચાલુ રાખવા માંગો છો. તમારી પાસે હવે ગુણધર્મોની સૂચિ હશે જે પૃષ્ઠ પરથી સીધા જ કા extી શકાશે. ઉદાહરણ તરીકે: પૃષ્ઠ શીર્ષક.
એક પસંદ કરવા માટે, ફક્ત તેને વિકલ્પોની સૂચિમાંથી પસંદ કરો અને ક્લિક કરો આગળ માં ડેટા ઉમેરવા માટે ડેટાસેટ.
જો તમે સંબંધિત HTML તત્વો પર ક્લિક કરવાની જરૂર છે તે આખા પૃષ્ઠથી સંબંધિત ચોક્કસ HTML તત્વોમાં ડેટા કાractવા માંગતા હો, તો તમે એક અથવા બહુવિધ આઇટમ્સ પસંદ કરી શકો છો. તેમ છતાં જો તમે બહુવિધ આઇટમ્સ પસંદ કરી રહ્યા છો, તો મહેરબાની કરીને પ્રયત્ન કરો અને બહુવિધ આઇટમ્સ પસંદ કરો કે જે પછી સ્તંભમાં બહુવિધ પંક્તિઓ જેવી હોય, કારણ કે જો સ્ક્રેપર કોઈ નિયમ બનાવી શકતો નથી કે જે ડેટાના પસંદ કરેલા સંગ્રહને અનન્ય રૂપે ઓળખી શકે, તો સ્ક્રેપ સૂચના નહીં કરે. બનાવવા માટે સમર્થ છે. વળી જો તમે ક્લિક કરી રહ્યાં છો તે બહુવિધ આઇટમ્સને અમારા વેબ સ્ક્રેપર વિઝાર્ડ દ્વારા પુનરાવર્તિત ડેટા તરીકે ઓળખવામાં આવી છે, તો તે જ જૂથમાંનો તમામ પુનરાવર્તિત ડેટા આપમેળે પસંદ કરવામાં આવશે. એકવાર તમે તમારી બધી સિંગલ અથવા મલ્ટીપલ આઇટમ્સ પસંદ કરી લો પછી સ્ક્રીનની નીચે ડાબી બાજુથી બહાર કા toવા માટે એક એટ્રિબ્યુટ પસંદ કરો અને પછી ક્લિક કરો આગળ.
ડેટાસેટ સ્ક્રીન તમને ડેટાની પ્રક્રિયા કેવી રીતે થાય છે તે બદલવાની મંજૂરી આપે છે, ઉદાહરણ તરીકે તમે તેની અંદર ડેટાસેટ અને કumnsલમ્સનું નામ બદલી શકો છો, નામ બદલવા માટે નામ પર ક્લિક કરો. જ્યારે તમે ડેટાસેટમાં ક columnલમ ઉમેરશો ત્યારે તમારે તે નમૂનાને પણ પસંદ કરવાની જરૂર છે જેમાં તે ચલાવવું જોઈએ. તમે ક theલમ નામ હેઠળ સ્થિત ડ્રોપ ડાઉન સૂચિ પર ક્લિક કરીને આને બદલી શકો છો.
ઘણીવાર ડેટા કાractતી વખતે, કેટલીક પુનરાવર્તિત વસ્તુઓ માટે અસંગત રીતે પુનરાવર્તન કરવું સામાન્ય છે, સુનિશ્ચિત કરવા માટે કે સાચી પંક્તિઓ હજી પણ એકબીજા સાથે સંકળાયેલ છે. ક Linkલમ લિંક કરો માપદંડ, ડેટાસેટમાં સૌથી સુસંગત સ્તંભ સાથે અસંગત સ્તંભોને લિંક કરવા.
ડેટાસેટમાં વધુ ડેટા ઉમેરવા માટે. પર ક્લિક કરો બટન અથવા ક્લિક કરો
ડેટાસેટમાંથી ડેટાને દૂર કરવા અથવા
સંપૂર્ણ ડેટાસેટ કા deleteી નાખવા માટે. ડેટાસેટ ડેટા પર વિવિધ માપદંડ લાગુ કરવાની પણ મંજૂરી આપે છે, આ કરવા માટે ટોચ પરથી ઇચ્છિત ક્રિયા પસંદ કરો અને પછી માપદંડ લાગુ કરવા માટે સંબંધિત ક columnલમ પર ક્લિક કરો. જો તમે માપદંડ ઉમેરવામાં ભૂલ કરો છો, તો ફક્ત ક્લિક કરો
બટન.
અહીં વિવિધ માપદંડના પ્રકારો અને તેનો ઉપયોગ કેવી રીતે કરવો તેની સૂચિ છે:
જ્યારે તમે ઉપરની ક્રિયાઓમાંની એક પસંદ કરી છે, જો તે બહુવિધ કumnsલમ્સને અસર કરી શકે છે, તો તે તમને પૂછશે કે શું તમે તેને ફક્ત કumnsલમ્સના સબસેટને અથવા તે બધાને અસર કરવાની મંજૂરી આપવા માંગો છો. મોટાભાગનાં કિસ્સાઓમાં તમે ઇચ્છો છો કે તે બધા કumnsલમ્સને અસર કરે, જો કે કેટલાક સંજોગોમાં તે અસરકારક સ્તંભોને મર્યાદિત કરવા માટે ઉપયોગી છે. ઉદાહરણ તરીકે, જો તમે શ્રેણી પસંદ કરી રહ્યા છો લેબલ્સ અને મૂલ્યો, જે વેબ પૃષ્ઠો પર સ્થિતિને બદલીને તમે બધા લેબલ્સ અને મૂલ્યો પસંદ કરી શકો છો. પછી ડેટાસેટમાં તેને ઇચ્છિત લેબલ સુધી મર્યાદિત કરવા બરાબર operationપરેશનનો ઉપયોગ કરો અને સ્પષ્ટ કરો કે ફક્ત લેબલ અને મૂલ્ય ક colલમ્સને અસર થવી જોઈએ. આ સુનિશ્ચિત કરશે કે પંક્તિઓ કા deletedી નાખવાથી અન્ય કumnsલમ અસરગ્રસ્ત નથી, સંપૂર્ણતા માટે તે લેબલ ક columnલમને છુપાવવા માટે ઉપયોગી થશે.
એકવાર તમે બધું કરવા માંગો છો તેમાં ફેરફાર કર્યા પછી, ક્લિક કરો આગળ અને, તમારી સ્ક્રેપ સૂચનો સ્ક્રેપમાં ઉમેરવામાં આવશે. જો તમારી ઇચ્છા હોય તો તમારી પાસે વધુ સ્ક્રેપ સૂચનો ઉમેરવાનો વિકલ્પ છે.
વેબપેજને સ્ક્રેપ કરવામાં આવે તે પહેલાં, ક્લિક કરીને, ટાઇપ કરીને અને ડ્રોપ ડાઉન્સથી મૂલ્યો પસંદ કરીને, તેને હેરાફેરી કરી શકાય છે. તે યાદ રાખવું અગત્યનું છે કે ભલે આ નવી વેબપેજને સ્ક્રેપ સૂચનો લોડ કરવા માટેનું કારણ બની શકે, જ્યાં સુધી બધી લાગુ સ્ક્રેપ સૂચનાઓ અમલમાં ન આવે ત્યાં સુધી ફરીથી પ્રારંભ થશે નહીં.
વેબપેજની ચાલાકી માટે, ક્યાં પસંદ કરો એલિમેન્ટ ક્લિક કરો, તત્વ હ Hવર, સ્ક્રોલ કરો, લખાણ લખો or ડ્રોપ ડાઉન સૂચિ મૂલ્ય પસંદ કરો ક્રિયાઓ. જો તમે ક્લિક ક્રિયા કરી રહ્યા છો, તો તમે વેબપેજ પરના સંખ્યાબંધ તત્વો પર ક્લિક કરી શકો છો. નહિંતર તમારે યોગ્ય એચટીએમએલ તત્વ પસંદ કરવું આવશ્યક છે, દાખલા તરીકે ટેક્સ્ટ ટેક્સ્ટ બ inક્સમાં ટાઇપ થવી જોઈએ. પછી ક્લિક કરો આગળ. આ એક વિકલ્પ બ openક્સ ખોલશે જે તમને ક્રિયા પૂર્ણ કરવાની મંજૂરી આપે છે. જ્યારે ટેક્સ્ટ ટાઇપ કરવું અને ડ્રોપ ડાઉનમાંથી ડેટા ટાઇપ કરવા અથવા પસંદ કરવા માટે પસંદ કરવો ત્યારે અનુક્રમે પસંદ કરવું આવશ્યક છે. તે સિવાય વિકલ્પો ત્રણેય ક્રિયાઓ માટે સમાન છે.
જો તમે ઇચ્છો છો કે તમે નમૂનાને પસંદ કરી શકો છો, આ ક્રિયા એક્ઝેક્યુટ થવી જોઈએ અને ક્લિક ક્રિયા માટે જે ટેમ્પલેટ લાગુ થાય છે, એકવાર ક્લિક ક્રિયા પૂર્ણ થઈ જાય. જો કે, તે જ પૃષ્ઠ પર બહુવિધ ક્લિક્સ કરેલી ક્લીક ક્રિયાને નવું ટેમ્પલેટ સોંપવું, એ સહેજ વિચાર નથી, જેમ કે ઇનલાઇન પ popપઅપ્સ ખોલવા અથવા સ્ક્રીન પર વસ્તુઓ દેખાય છે. આ કારણ છે કે જો ક્લિક ક્રિયા ફક્ત અમુક નમૂનાઓ પર જ ચલાવે છે, તો પ્રથમ ક્લિક દ્વારા સોંપાયેલ નવું નમૂના ફરીથી સેટ કરવામાં આવશે નહીં અને તેથી તે કેવી રીતે સ્ક્રેપ લખાયેલ છે તેના આધારે તે જ પૃષ્ઠ પરના ભાવિ ક્લિક્સને ચલાવવામાં અટકાવી શકે છે. તમે પણ વ્યાખ્યાયિત કરી શકો છો જો તમે ઇચ્છો છો કે આ ક્રિયા ફક્ત એક જ વાર ચલાવવામાં આવે, જે ઉપયોગી છે જો તમે લ likeગિન જેવું કંઇક કરી રહ્યાં છો intઓએ વેબસાઇટ.
પ્રકાર લખાણ અથવા પસંદ કરો ડ્રોપ ડાઉન સૂચિ મૂલ્ય ક્રિયાઓ તમને અનુક્રમે લખાણની ઘણી આઇટમ્સ ટાઇપ કરવાની અથવા બહુવિધ પસંદ બ selectક્સ પસંદગીઓ કરવાની મંજૂરી આપે છે. આને સ્ક્રેપ સૂચનો પર ક્લિક કરીને સંપાદિત કરી શકાય છે ચલ બદલો અથવા જુઓ ડાબી બાજુ સ્ક્રીનશ toટમાં બતાવ્યા પ્રમાણે બટન.
જો તમે શોધ બ youક્સ પર નામોની સૂચિ ટાઇપ કરવા માંગતા હો, તો આ મહત્વપૂર્ણ બની શકે. શોધ બ boxક્સમાં કોઈ મૂલ્ય હોય ત્યારે જ ફોર્મ સબમિટ થાય છે તેની ખાતરી કરવા માટે, દરેક વખતે ટેક્સ્ટ સફળતાપૂર્વક ટાઇપ કરવામાં આવે ત્યારે નમૂના સેટ કરી શકાય છે into ટેક્સ્ટબ .ક્સ અને બટન પર ક્લિક ક્રિયા કરવામાં નહીં આવે ત્યાં સુધી આ નમૂના સેટ ન થાય ત્યાં સુધી. ક્લિક ક્રિયા પૂર્ણ થઈ ગયા પછી, નમૂનાને ફરીથી સેટ કરવાની પ્રક્રિયાને ફરીથી સેટ કરવાની જરૂર રહેશે.
વેબસાઇટ્સને ચાલાકી આપતી ક્રિયાઓ પછી, ક્રિયાઓ એજેક્સ વિધેય શરૂ કરે છે, થોડા સમય માટે રાહ જોવી ઉપયોગી છે, સ્ક્રેપ સાથે ચાલુ રાખતા પહેલા એજેક્સ સામગ્રીને લોડ કરવાની મંજૂરી આપવા માટે. તમે આમાં વિલંબ ઉમેરીને કરી શકો છો એક્ઝેક્યુશન પછી પ્રતીક્ષા કરો ટેક્સ્ટ બૉક્સ.
એકવાર કેટલીક શરત પૂરી થઈ જાય પછી તમે સીધા જ અલગ URL પર જવા માટે ઇચ્છા કરી શકો છો. આ કરવા માટે URL પર જાઓ ક્રિયા, જે ફક્ત ત્યારે જ દેખાશે જ્યારે ઓછામાં ઓછા એક નમૂનાને સ્ક્રેપમાં વ્યાખ્યાયિત કરવામાં આવી હોય અને જ્યારે બનાવવામાં આવે ત્યારે તે નમૂનાને સોંપવું આવશ્યક છે, અનંત લૂપ્સને ટાળવા માટે મદદ કરવા માટે.
આખરે તમે તમારા વેબ સ્ક્રેપ્સમાં ગ્રેબઝિટના ક captureપ્ચર એપીઆઇનો તમામ ઉપયોગ કરી શકો છો, ફક્ત કેપ્ચર વેબપેજ ક્રિયા પસંદ કરો અને તમારી ઇચ્છિત કેપ્ચર પસંદ કરો. એકવાર તમે આ પસંદ કરો ત્યારે એક્ઝિક્યુટ કરવા માટેના નમૂનાને સ્પષ્ટ કરીને તમે સ્ક્રેપની અંદરના કેટલાક વેબ પૃષ્ઠોને કેપ્ચર કરવા માટે આને મર્યાદિત કરી શકો છો આગળ બટન.
દરેક સ્ક્રેપ સૂચના ઉમેર્યા પછી તે સ્ક્રેપ સૂચનો પેનલમાં જોઇ શકાય છે, દરેક સ્ક્રેપ સૂચનાની બાજુમાંનો ક્રોસ સ્ક્રેપ સૂચનાને કા beી નાખવાની મંજૂરી આપે છે. જો સ્ક્રેપ સૂચના કા isી નાખવામાં આવે છે જે અન્ય સ્ક્રેપ સૂચનો દ્વારા જરૂરી છે તે સૂચનાઓ પણ કા areી નાખવામાં આવી છે. તમે ગ્રેબ આઇકોન સાથે કોઈપણ સ્ક્રેપ સૂચનોને ખેંચીને સ્ક્રેપ સૂચનોનો ક્રમ બદલી શકો છો.
જો તમારે સ્ક્રેપ સૂચનોને વધુ વિશિષ્ટ રીતે કસ્ટમાઇઝ કરવાની જરૂર હોય તો તમારે જાતે જ સ્ક્રેપ સૂચનોને બદલવાની જરૂર રહેશે.
સ્ક્રેપ સૂચનો જાવાસ્ક્રિપ્ટ આધારિત છે અને કોડ સંપાદક સિન્ટેક્સ તપાસનાર, સ્વત completeપૂર્ણ અને ટૂલટિપ્સની સાથે શક્ય તેટલું સરળ બનાવવા માટે સંપૂર્ણ આવે છે.
કોડ સંપાદકની મુખ્ય કાર્યક્ષમતા મેનૂ વિકલ્પો દ્વારા ibleક્સેસિબલ છે, જેમ કે સ્ક્રીનશોટમાં બતાવ્યા પ્રમાણે, દરેકનો હેતુ નીચે નીચેથી સમજાવવામાં આવ્યો છે. જ્યારે તમારી સ્ક્રેપ સૂચનોમાં કોઈપણ વાક્યરચના ભૂલો કોડ સંપાદકના ડાબા હાથની ગટરમાં સૂચવવામાં આવે છે.
વિઝાર્ડ તમને પૃષ્ઠના કેટલાક ભાગોને પસંદ કરવાની મંજૂરી આપે છે જેને તમે ઉતારો લેવા અને વેબ ક captપ્ચર્સ બનાવવા જેવા અન્ય સામાન્ય કાર્યો કરવા માંગો છો.
વપરાશકર્તાને સ્ક્રેપ સૂચનો કોડ દર્શાવે છે.
બધી સ્ક્રેપ સૂચનો કાtesી નાખે છે.
પૃષ્ઠ કીવર્ડ દાખલ કરશે intઓ સ્ક્રેપ સૂચનો અને સ્વત autoપૂર્ણને ખોલો, જેમાં તમામ શક્ય હોય છે પૃષ્ઠ કાર્યો. પૃષ્ઠ કાર્યો તમને વેબ પૃષ્ઠમાંથી ડેટા કાractવા માટે પરવાનગી આપે છે.
ડેટા કીવર્ડ દાખલ કરશે intઓ સ્ક્રેપ સૂચનો. ડેટા કાર્યો તમને પરવાનગી આપે છે save માહિતી.
નેવિગેશન કીવર્ડમાં પ્રવેશ કરે છે intકોડ સંપાદક. આ નેવિગેશન કાર્યો વેબ સ્ક્રેપર લક્ષ્ય વેબસાઇટ કેવી રીતે નેવિગેટ કરે છે તેને નિયંત્રિત કરવાની મંજૂરી આપે છે.
વૈશ્વિક કીવર્ડમાં પ્રવેશ કરે છે intઓ સ્ક્રેપ સૂચનો. આ તમને accessક્સેસ આપે છે કાર્યો જે વિવિધ વેબ પૃષ્ઠોને વિશ્લેષિત કરવા વચ્ચે ડેટા સ્ટોર કરી શકે છે. સ્ક્રેપ સૂચનાઓ લખતી વખતે, તે યાદ રાખવું મહત્વપૂર્ણ છે કે સ્ક્રેપર વેબપૃષ્ઠો વચ્ચે ખસી જાય ત્યારે સ્ક્રેપ સૂચનોમાં જાવાસ્ક્રિપ્ટ ચલોની સ્થિતિ રાખવામાં આવતી નથી, સિવાય કે તમે વૈશ્વિક કાર્યોનો ઉપયોગ કરો. save ચલો, નીચે બતાવ્યા પ્રમાણે.
Global.set("myvariable", "hello"); var mrvar = Global.get("myvariable");
નીચે બતાવ્યા પ્રમાણે, ગ્લોબલ.સેટ પદ્ધતિમાં સતત પરિમાણને સાચા વૈશ્વિક ચલ પાસ બનાવવા માટે.
Global.set("myvariable", "hello", true);
યુટિલિટી કીવર્ડમાં પ્રવેશ કરે છે intઓ સ્ક્રેપ સૂચનો. આ તમને ઉપયોગ કરવાની મંજૂરી આપે છે સામાન્ય કાર્યો જે ક્વેરી ઉમેરવા અથવા દૂર કરવા જેવા સ્ક્રrapપ્સ લખવાનું સરળ બનાવે છેstring URL ના પરિમાણો.
માપદંડ કીવર્ડ દાખલ કરે છે intઓ સ્ક્રેપ સૂચનો. આ કાર્યો ડુપ્લિકેટ્સને દૂર કરવા જેવા તમારા સ્ક્રેપ દરમિયાન કા extવામાં આવેલા ડેટાને તમે શુદ્ધ કરવાની મંજૂરી આપે છે.
તમને સરળતાથી ફિલ્ટર બનાવવાની મંજૂરી આપે છે, વેબ પૃષ્ઠમાંથી કોઈ વિશિષ્ટ HTML તત્વ પસંદ કરવા માટે કેટલાક કાર્યો દ્વારા આ જરૂરી છે. ફક્ત તમારા લક્ષ્ય તત્વના અને / અથવા તત્વના માતાપિતા (ઓ) ને તે તત્વ પસંદ કરવા જોઈએ તે વિશેષતાઓની પસંદગી કરો. ખાતરી કરો કે તમે આ વિકલ્પને ક્લિક કરો તે પહેલાં ફિલ્ટરને પણ પસાર કરવા માટે તમારું કર્સર કાર્યમાં યોગ્ય સ્થાને છે.
તમને સ્ક્રીનશોટ વિકલ્પો સેટ કરવાની મંજૂરી આપે છે. ટૂલટિપ દ્વારા ઓળખાય છે તે પ્રમાણે, ફંક્શનના યોગ્ય ભાગમાં ફક્ત કર્સર મૂકો અને સ્ક્રીનશોટ વિકલ્પોને દબાવો. પછી તમે ઇચ્છો તે બધા વિકલ્પો પસંદ કરો અને આદેશ દાખલ કરો.
Stringલખાણને વ્યાખ્યાયિત કરવા માટે, વેબ સ્ક્રેપ કરતી વખતે, સ્ક્રેપ સૂચનોમાં ઉપયોગ થાય છે. એ string ડબલ દ્વારા સીમાંકિત થયેલ છે ("
) અથવા એક અવતરણ ('
). જો string તે ડબલ ક્વોટથી શરૂ થયેલ છે તે ડબલ ક્વોટ સાથે સમાપ્ત થવું જોઈએ, જો એ string એક ક્વોટથી શરૂ થાય છે તે એક જ ક્વોટ સાથે સમાપ્ત થવું જોઈએ. દાખલા તરીકે:
"my-class"
અને 'my-class'
સામાન્ય ભૂલ કે જે બંધ થઈ શકે છે તે બંધ છે string ભૂલ, આ જ્યારે છે string ઉપર બતાવ્યા પ્રમાણે સમાપ્તિ ક્વોટ નથી અથવા ત્યાં એક રેખા વિરામ છે string. નીચેના ગેરકાયદેસર છે strings:
"my
class"
"my class
આ ભૂલને ઠીક કરવી એ ખાતરી કરવાની છે કે તેમાં લીટી વિરામ શામેલ નથી અને તેમાં મેચિંગ અવતરણો નથી, જેમ કે:
"my class"
અને "my class"
કેટલીકવાર તમે એકમાં દેખાવા માટે એક અથવા ડબલ ક્વોટ માંગો છો string. આનો સૌથી સહેલો રસ્તો એ એકમાં એક ક્વોટ મૂકવો string એ માં ડબલ અવતરણ અને ડબલ ક્વોટ સાથે સીમાંકિત string એક અવતરણ સાથે સીમાંકન, જેમ કે:
"Bob's shop"
અને '"The best store on the web"'
વૈકલ્પિક રીતે તમે આ જેવા અવતરણથી બચવા માટે બેકસ્લેશનો ઉપયોગ કરી શકો છો:
'test\'s'
જ્યારે વેબ સ્ક્રેપર પીડીએફ, એક્સએમએલ, જેએસઓન અને આરએસએસ પર આવે છે ત્યારે તે તેને એક HTML અંદાજમાં રૂપાંતરિત કરશે, જે અમારા વેબ સ્ક્રેપરને તેને યોગ્ય રીતે વિશ્લેષણ કરવાની મંજૂરી આપે છે અને તમે કઈ સામગ્રી કા extવા માંગો છો તે પસંદ કરવા માટે. ઉદાહરણ તરીકે, જો તમે JSON ડેટાને વિશ્લેષિત કરવા માંગતા હો, તો તે ડેટાને રૂપાંતરિત કરશે intબાજુએ બતાવ્યા પ્રમાણે Oa હાયરાર્ચલ HTML પ્રતિનિધિત્વ. આ તમને સામાન્યની જેમ સ્ક્રેપ સૂચનો બનાવવાની મંજૂરી આપે છે.
તેવી જ રીતે જ્યારે સ્ક્રેપર પીડીએફ દસ્તાવેજ લોડ કરે છે, ત્યારે પીડીએફ કન્વર્ટ થાય છે into છબીઓ, હાયપરલિંક્સ, ટેક્સ્ટ અને કોષ્ટકોને પસંદ કરવા અને સ્ક્રેપ કરવાની મંજૂરી આપવા માટે HTML. જો કે પીડીએફની કોઈ વાસ્તવિક રચના નથી, તેમ કોષ્ટકો હ્યુરીસ્ટિક્સનો ઉપયોગ કરીને ઓળખવામાં આવે છે અને તેથી હંમેશાં ચોક્કસ હોતા નથી.
આ ટેબ તમને તમારા પરિણામો કેવી રીતે એક્સેલ કરવા માંગો છો તે પસંદ કરવા દે છે, જેમાં એક્સેલ સ્પ્રેડશીટ્સ, એક્સએમએલ, જેએસઓન, સીએસવી, એસક્યુએલ આદેશો અથવા એચટીએમએલ દસ્તાવેજો શામેલ છે. આ ઉપરાંત, આ ટેબ ઝિપ સ્ક્રેપ પરિણામોના નામને સેટ કરવાની મંજૂરી આપે છે. જો તમે ફક્ત ફાઇલો ડાઉનલોડ કરી રહ્યાં છો અથવા વેબ કેપ્ચર્સ બનાવી રહ્યા છો, તો પછી નિકાસ વિકલ્પ પસંદ કરવાની જરૂર નથી કારણ કે તમને ફક્ત પરિણામવાળી એક ઝીપ ફાઇલ પ્રાપ્ત થશે. આ ટ tabબ તમને પરિણામોને કેવી રીતે મોકલવા માંગે છે તે નિર્દિષ્ટ કરવાની મંજૂરી આપે છે. તમે દ્વારા પરિણામો મોકલી શકો છો એમેઝોન S3, ડ્રૉપબૉક્સ, ઇમેઇલ સૂચના, FTP અને વેબડેવ.
અંતિમ વિકલ્પ ક Callલબbackક URL છે, જે સ્ક્રેપ પરિણામોને તમારી એપ્લિકેશનમાં તમારી એપ્લિકેશનમાં પ્રક્રિયા કરવાની મંજૂરી આપે છે સ્ક્રેપ API.
ઝિપ કરેલા પરિણામોનું ફાઇલનામ અથવા દરેક ડેટા ફાઇલ જો તમે તેમને અલગથી મોકલવાની વિનંતી કરો છો તો ડિફaultલ્ટ ફાઇલનામનો ઉપયોગ કરો વિકલ્પને અનચેક કરીને અને તમારા ઇચ્છિત ફાઇલનામને સેટ કરીને સેટ કરી શકાય છે. વધુમાં, ટાઇમસ્ટેમ્પ મૂકીને તમારા ફાઇલનામમાં ઉમેરી શકાય છે {GrabzIt_Timestamp_UTC+1}
ફાઇલનામમાં. +1 યુટીસીથી કલાકોમાં setફસેટ સૂચવે છે.
તમે ક્લિક કરીને સ્ક્રેપના પરિણામો પણ જોઈ શકો છો પરિણામ જુઓ બટન, આગળ તમારા ઉઝરડા, આ કોઈ પણ રીઅલ-ટાઇમ સ્ક્રેપ પરિણામો બતાવશે, તેમજ છેલ્લા 48 કલાકમાં કરવામાં આવેલા અગાઉના પરિણામો પણ બતાવશે.
વેબ સ્ક્રેપ બનાવતી વખતે શેડ્યૂલ સ્ક્રેપ ટેબ તમને સેટ કરવાની મંજૂરી આપે છે જ્યારે તમે સ્ક્રેપ શરૂ કરવા માંગો છો અને જો તમે તેને પુનરાવર્તન કરવા માંગતા હોવ, તો તે કેટલી વાર કરવું જોઈએ. જ્યારે વેબ પેજ પર ફેરફાર જોવા મળે છે ત્યારે સ્ક્રેપને ચલાવવા માટે પણ ગોઠવી શકાય છે. આ કરવા માટે જ્યારે વેબ પૃષ્ઠ બદલાય ત્યારે પ્રારંભ કરો ચેકબૉક્સ, પછી મોનિટર કરવા માટે વેબ પૃષ્ઠનું URL દાખલ કરો, સાથે સીએસએસ પસંદગીકાર પૃષ્ઠના જે ભાગ તમે છો interested in. અસંગત ફેરફારોને કારણે ખોટા હકારાત્મક ટાળવા માટે પૃષ્ઠનો એક નાનો ભાગ પસંદ કરવામાં આવે તે મહત્વનું છે.
એકવાર વેબ સ્ક્રેપ શરૂ થઈ જાય પછી સ્થિતિ આયકન તેમાં બદલાઈ જશે અને પ્રક્રિયા કરેલા પૃષ્ઠો સમય જતાં વધવાનું શરૂ કરશે. સ્ક્રેપ્સ પ્રગતિનો એક વાસ્તવિક સમયનો સ્નેપશોટ નિયમિતપણે છેલ્લા વેબ પૃષ્ઠના નિયમિત સ્ક્રીનશshotટ સાથે પેદા થવાની સાથે એક લોગ ફાઇલ સાથે પેદા થાય છે જે સ્ક્રેપરનો સામનો કરવો પડ્યો છે. આ તમને સ્ક્રેપ દરમિયાન શું થઈ રહ્યું છે તે જોવા દે છે. આ માહિતી શોધવા માટે, તમારા સ્ક્રેપની બાજુમાં વિસ્તૃત ચિહ્ન પર ક્લિક કરો અને ક્લિક કરો દર્શક તમે છો તે ઉઝરડા માટે intતેમાં રસ છે. જો તમારી ભંગાર સૂચનાઓમાં કોઈ સમસ્યા આવી હોય તો તેમાં વિગતો હોવી જોઈએ.
એકવાર સ્ક્રેપ સફળતાપૂર્વક પૂર્ણ થઈ જાય પછી સ્થિતિ આયકન સ્વિચ થઈ જશે , જો ત્યાં દર્શક ખોલીને કોઈ પરિણામ ન હોય તો લોગ અને છેલ્લું સ્ક્રીનશોટ તમને કહી શકે છે કે શું ખોટું થયું છે.
લોગમાં નોંધાયેલી સૌથી સામાન્ય સમસ્યામાંની એક, પૃષ્ઠને ભંગારવામાં પૂરતું રેન્ડરિંગ વિલંબ નથી, ઘણીવાર તેમાં થોડો વધારો પૃષ્ઠ લોડ વિલંબ માં મળી સ્ક્રેપ વિકલ્પો મોટાભાગની વેબસાઇટ્સ માટે ટ tabબ પૂરતું છે.