એવા કેટલાક ઉદાહરણો છે જ્યારે સંપૂર્ણ વેબસાઇટને ડાઉનલોડ કરવાનું મહત્વપૂર્ણ છે, માત્ર સમાપ્ત પરિણામ નથી. પરંતુ એચટીએમએલ વેબ પૃષ્ઠો, સીએસએસ, સ્ક્રિપ્ટો અને છબીઓ જેવા સંસાધનો.
આ કદાચ કારણ કે તમને કોડનો બેકઅપ જોઈએ છે પરંતુ હવે કોઈ કારણોસર મૂળ સ્રોત પર જઈ શકતા નથી. અથવા કદાચ તમને સમયની સાથે વેબસાઇટ કેવી રીતે બદલાઈ ગઈ તેનો વિગતવાર રેકોર્ડ જોઈએ છે.
સદ્ભાગ્યે ગ્રેબઝિટનો વેબ સ્ક્રેપર વેબસાઇટ પરના બધા વેબ પૃષ્ઠો પર ક્રોલ કરીને આ પ્રાપ્ત કરી શકે છે. પછી દરેક વેબ પૃષ્ઠ પર તવેથો પૃષ્ઠ પર સંદર્ભિત કોઈપણ સંસાધનો સાથે, HTML ડાઉનલોડ કરે છે.
તમારી વેબસાઇટને શક્ય તેટલી સરળ ડાઉનલોડ કરવા માટે GrabzIt એક સ્ક્રેપ નમૂના પ્રદાન કરે છે.
પ્રારંભ કરવા માટે આ નમૂના લોડ કરો.
પછી તમારા દાખલ કરો લક્ષ્ય URL, પછી આ URL ને ભૂલો અને કોઈપણ જરૂરી ફેરફારો કરવા માટે આપમેળે તપાસવામાં આવે છે. રાખો સ્ક્રેપ આપમેળે પ્રારંભ કરો ચેકબોક્સ ટિક કર્યું, અને તમારું સ્ક્રેપ આપમેળે શરૂ થશે.
જો તમે નમૂનાને બદલવા માંગતા હો, તો અનચેક કરો સ્ક્રેપ આપમેળે પ્રારંભ કરો ચેકબોક્સ. એક ફેરફાર એ નિયમિત શેડ્યૂલ પર સ્ક્રેપ ચલાવવાનું છે, ઉદાહરણ તરીકે, વેબસાઇટની નિયમિત નકલો બનાવવી. પર શેડ્યૂલ સ્ક્રેપ ટ tabબ, ખાલી ક્લિક કરો પુનરાવર્તન સ્ક્રેપ ચેકબોક્સ અને પછી તમે સ્ક્રેપને કેટલી વાર પુનરાવર્તન કરવા માંગો છો તે પસંદ કરો. પછી ક્લિક કરો અપડેટ સ્ક્રેપ શરૂ કરવા માટે.
એકવાર સ્ક્રેપ સમાપ્ત થઈ જાય પછી તમને એક ઝીપ ફાઇલ મળશે. આગળ ઝિપ ફાઇલને અર્ક કા andવા અને અંદર ફાઇલો કહેવાતી ડિરેક્ટરીમાં સ્થિત એ બધા ડાઉનલોડ કરેલા વેબ પૃષ્ઠો અને વેબસાઇટ સંસાધનો હશે. ડિરેક્ટરીના મૂળમાં એક વિશિષ્ટ HTML પૃષ્ઠ પણ હશે જે ડેટા. Html કહેવાશે. આ ફાઇલને વેબ બ્રાઉઝરમાં ખોલો અને તમને ત્રણ કumnsલમ સાથે એક HTML ટેબલ મળશે:
આ ફાઇલ તમને નવા ફાઇલનામોને તેમના જૂના સ્થળો પર નકશામાં સહાય કરવા માટે બનાવવામાં આવી છે. આ જરૂરી છે કારણ કે URL ને ફાઇલ સ્ટ્રક્ચર પર સીધા જ મેપ કરી શકાતા નથી કારણ કે URL સીધા ફાઇલ પાથમાં સંગ્રહિત કરવા માટે ખૂબ મોટો હોઇ શકે.
ત્યાં પણ ઘણા ક્રમચયો હોઈ શકે છે ખાસ કરીને જ્યારે વેબ પૃષ્ઠ વિવિધ ક્વેરીને બદલીને ઘણી બધી સામગ્રીનું પ્રતિનિધિત્વ કરી શકે string પરિમાણો! તેથી તેના બદલે અમે ફાઇલને ફોલ્ડરમાં ફ્લેટ સ્ટ્રક્ચરમાં વેબસાઇટ સ્ટોર કરીએ છીએ અને આ ફાઇલોને મૂળ સ્ટ્રક્ચર પર મેપ કરવા માટે તમને ડેટા. Html ફાઇલ આપીશું.
અલબત્ત આને કારણે તમે ડાઉનલોડ કરેલા HTML પૃષ્ઠને ખોલી શકતા નથી અને વેબ પર તમે જોયું તે વેબ પૃષ્ઠ જોવાની અપેક્ષા રાખી શકો છો. આ કરવા માટે તમારે છબી, સ્ક્રિપ્ટ અને સીએસએસ સંસાધનો વગેરેનાં પાથોને ફરીથી લખવાની જરૂર પડશે જેથી HTML ફાઇલ તેમને તમારા સ્થાનિક ફાઇલ માળખામાં શોધી શકે.
બીજી ફાઇલ કે જે ઝીપ ફાઇલના મૂળમાં સમાવવામાં આવશે તેને વેબસાઇટ.csv કહેવામાં આવે છે. આમાં ડેટા એચટીએમએલ ફાઇલ જેવી જ માહિતી શામેલ છે. જો કે, તમે ડાઉનલોડ વેબસાઇટને ફરીથી બનાવવા માટે URL ની ફાઇલોમાંથી મેપિંગનો ઉપયોગ કરીને પ્રોગ્રામ રીતે વેબસાઇટ ડાઉનલોડને વાંચવા અને પ્રક્રિયા કરવા માંગતા હો તે કિસ્સામાં આ સમાવવામાં આવેલ છે.