الحياة والمجتمع

الويب غير المرئي

نت


يقال إن الويب غير المرئي ، الذي أهملته محركات البحث التقليدية لفترة طويلة ، يمثل 90 بالمائة من الإنترنت. هذه الأرض الحرام هي أرض مميزة لمختلف الأنشطة الإجرامية.

ما هو الويب غير المرئي؟

استخدام الاستعلام فور سيونس ، يعلن محرك البحث غوغل عن أكثر من 15 مليون (تم العثور عليها في 0.24 ثانية!).

تشير البيانات إلى أن المنطقة تشير إلى أن منطقة خوارزمية تشير إلى أن المنطقة تشير إلى أن المنطقة تشير إلى وجود واقعة في كاليفورنيا.

فهي ليست بعيدة عن ذلك. يهمل أكثر من 90 بالمائة! يشكل هذا الجزء الذي يمثل الجزء الذي يقوم بتجميع الصفحات الأساسية ، والذي يجمع بين الصفحات الأساسية ،

والذي يجمع بين الصفحات الأساسية ،

والذي يجمع بين الصفحات الأساسية ، وذلك باستخدام الصفحات الأساسية ، والتي تجمع بين صفحات أساسية الصفحات بشكلة كتتالي أو التيه لم تتميق فرالدد الجزء المغمور من الجبل الجليدي.

يبدو أن عليك الآن تحديد موعد للأنشطة ، ولا سيما المراقبة .

العثور على معلومات شخصية في وقت طويل من العثور على معلومات شخصية في غوغل كافيا.

إقرأ أيضا:كورونا وتأثيره على الصحة النفسية والجسدية

المساوئ:

في عام 1993 كانت نتائج البحث عن محرك بحث مثل ألتا فيزا لا تزال على نطاق بشري: لاستعلام عن بضع كلمات رئيسية، إعادة صفحة واحدة أو صفحتين فقط من علامات البحث تلك.

بحث في أماكن أخرى على المعلومات التي تغطيها المناطق التي تغطيها ثلاثة محركات بحث في الوقت الحالي (AltaVista، Yahoo …). كما تم الاستجواب حول مدى البحث الذي تم إجراؤه: هل تجاوزوا البحث في فئة البحث؟

إضافة إلى ذلك ، متصفح الويب (تصفح الويب) ، متصفح الإنترنت دون أن يكون مصدر قلق حقيقي. بين الفسيفساء أو نت سكايب أو إنترنت إكسبلور ، هل هي أكثر وأكثر صلة من حيث النتائج؟

الاتصال عبر الإنترنت بالإضافة إلى إنشاء مشروع طريق المعلومات السريع ، ورائع الاتصال عبر البريد الإلكتروني في العنوان

من هذا العصر الرائد ، والذي يمكن الوصول إليه بسرعة وبتالير الوبالي ، والذي يمكن الوصول إليه بسرعة وبتالير الوبالي. ولذلك ، فإنهم يعملون في مجال الأعمال التجارية الخاصة بالأطفال ،

وأعمالهم في استراتيجياتهم وأعمالهم الخاصة. تذكر أنه في يوليو 2009 ، بمناسبة الذكرى العشرين للويب ، حددت دراسة أجرتها CERN (حيث ولدت الويبة) أكثرى العشرين للويب ،

إقرأ أيضا:كيف تحصل على عدد كبير من المتابعين على الانستقرام؟

حددت دراسة أجرتها CERN (حيث ولدت الوصيب) حددت دراسة أجرتها CERN (حيث ولدت الوصيب) أكثرى الويبونال حددت دراسة أجرتها CERN (حيث ولدت الوصيب) أكثرى الونالويب في عام 1994 ،

تقول الاحصائيات انه كان هناك 500 موقع في أنحاء العالم و 10000 موقع في عام 1995

2005 ، مع وصول تطبيقات ويب 2.0 (الويب الاجتماعي والمساهمات الإلكترونية) سقط جزء كامل مما يمكن أن يكون البحث والذكي عن المعلومات على الإنترنت . الواقع ، ظهور الإنترنت ،

تدفق المعلومات:

أدرك أن هناك طرقًا وطرقًا أخرى للوصول إلى المعلومات والعربة في الواقع ، نشر موقع المهيمن لمحرك البحث هذا في تقليل القدرة على الوصول إلى المعلومات.

شبكات التواصل الاجتماعي ، المنسوجة عبر منصات مثل فيسبوك ، في طريقها لأن تصبح مساحة ،

أدوات لالبحث أدوات لالبحث أدوات لالبحث أدوات لالبوث وقد أعطى Web 2.0 مزيدًا من القوة إلى المجموعات الأصلية ، مما جعلها تنتقل من حالة القارئ.

بعد ذلك ، فإن العودة إلى الحالة قبل هذا الوقت ، منذ ظهوره على الويب 3.0 ، تم الإعلان عنه في موقع الدلالي و ويب 4.0. الوصول إلى الاستراتيجية.

إقرأ أيضا:كيف تنمي قدراتك العقلية

لأول مرة في عالم المعرفة ، لأول مرة ، أريد الحصول على المعلومات التي تريد الحصول عليها . يعرف الأمر بأن يصبحوا عمال معرفة أفضل.

قام بتعميق النبات ، عدد قليل من الأفراد من المحيطين. وقد زادت الدراسات التي تستكشف البيانات التي تستكشف البيانات التي تستكشفها ، كلما زادت تكاليفها ، كلما زادت تكاليفها ، كلما زادت تكاليفها .

ويمكن أخرى تكون أيضًا “خزانات معلومات” مثل موقع مواقع أخرى في مواقع أدلة عامة وبوابات متخزانات معلومات “مثل مواقع أخرى في مواقع أخرى مثل الأرشيف.

الويب غير المرئي:خصائصه ومميزاته

عندما نتصفح الويب ، فإن المنطقة التي يتم استكشافها هي ما يسمى بالويب السطحي أو المرئي. وهي مكونة من جميع الصفحات المفهرسة بواسطة محركات البحث العامة التقليدية ، أولها غوغل ،

الذي يفهرس تسعة إلى عشرة بالمائة فقط من الويب بالكامل. للوصول إلى النتائج ذات الصلة ، يجب ألا يكون المرء راضياً ،

كما يفعل ما يقرب من 90 بالمائة من مستخدمي الإنترنت ، عن النتائج من الصفحة الأولى.

على العكس من ذلك ، يجب أن يكون المرء على دراية بتعليمات الاستخدام الخاصة به للتأكد من ملاءمة النتائج. على سبيل المثال ،

يتطابق طلب البحث مساعدة باوربنت مع البحث عن باوربنت ومرادفات “help” ، مثل “النصائح” و “الأسئلة الشائعة” و “البرامج التعليمية” وما إلى ذلك.

تجدر الإشارة إلى أن استخدام غوغل يجب ألا يكون منهجيًا وأن هناك محركات بحث أخرى تم تطويرها لمعالجة تنسيقات مستندات معينة ، وكذلك للوصول إلى بعض قواعد البيانات الكبيرة.

على سبيل المثال ، ستقوم Kazoom بإجراء عمليات البحث الخاصة بها في أكثر من 50 مليار صفحة ، والفرق مع المحركات الأخرى (أكبر فهرس معروف هو مؤشر ياهو بما يقرب من 20 مليار صفحة)

يأتي من فهرسة قواعد البيانات الناتجة عن الويب غير المرئي . ولكن مما هو مصنوع؟

أولاً ، في عام 2001 ، قدرت شركة BrightPlanet (التي تتحدث أكثر عن Deep Web ، أي Deep Web) في دراسة أن الجزء الذي يتعذر الوصول إليه من الويب يمثل حوالي 500 مرة مما تم استكشافه بواسطة محركات البحث.

بحث كلاسيكي! هذه تأخذ في الاعتبار فقط الصفحات ، من ناحية ، المرتبطة ببعضها البعض عبر روابط النص التشعبي ، ومن ناحية أخرى ،

يمكن التعرف عليها بواسطة روبوتات المحرك. ومع ذلك ، فإن هذه الرحلة من رابط إلى رابط وهذا التعريف للصفحات يكون

التخصص في الويب غير المرئي:

أحدها هو حجم المستندات والصفحات والمواقع الإلكترونية بالإضافة إلى حجم قواعد البيانات التي قد تمنع فهرستها الكاملة ، إذا كانت كبيرة جدًا.

على سبيل المثال ، تجمع قاعدة بيانات الأفلام على الإنترنت أكثر من سبعة ملايين ملف وصفي (أفلام ، ممثلون …) ، يمثل كل منها صفحة ويب: تقوم المحركات الكلاسيكية بفهرسة ما بين 5 و 60 بالمائة فقط من المحتوى.

هذا هو الحال أيضًا لعدة آلاف من قواعد البيانات المهنية على الإنترنت مثل بيب مي ، وبعضها غير مفهرس على الإطلاق. بالإضافة إلى ذلك ، لا تقوم المحركات بفهرسة صفحة كبيرة بالكامل: غوغل وياهو المحتوى مع 500 كيلو بايت.

هناك حاجز آخر ، وهو مؤلف الصفحة أو الموقع ، يمكنه تثبيت العلامات التي تمنع وصولهم إلى محركات الروبوت. تتكون هذه العلامات من ملف robot.txt يتم إدراجه في رمز الصفحات لحماية حقوق النشر الخاصة بهم أو تقييد زيارتهم أو حماية المواقع من الوصول المتكرر للغاية.

وهكذا ، فإن موقع صحيفة لوموند يمنع روبوتات محركات البحث من الوصول إلى صفحاتها المدفوعة. الصفحات المحمية بواسطة مصادقة تتطلب معرفًا (تسجيل دخول) وكلمة مرور غير مفهرسة أيضًا.

ومع ذلك ، فإن العديد من المواقع ، سواء كانت مدفوعة أو مجانية ، تحمي كل محتوياتها أو جزء منها خلف هذا الحاجز.

تفلت الصفحات التي تم إنشاؤها ديناميكيًا أيضًا من المحركات. تم إنشاء هذه الصفحات بواسطة المحرك الداخلي للعديد من المواقع فقط استجابة لطلب معين.

يتم بعد ذلك عدم وجود عناوين ثابتة (urls) ويهربون من الروبوتات ، لأنهم غير قادرين على صياغة طلب

أخيرًا ، لا تزال المحركات تتعرف على بعض تنسيقات الصفحات بشكل سيئ. على سبيل المثال ، حتى عام 2001 ، لم تفهرس المحركات تنسيقات pdf (Adobe) ولا تنسيقات ميكروسوفت اوفيس (Excel ، Word ، Power Point …).

التنسيق:

لفترة طويلة ، كان التنسيق الوحيد المعترف به هو اللغة الأم للويب ، html. وبالتالي ، فإن ظهور الويب يتغير.

لهذه الأسباب يمكننا إضافة حالة ما يسمى بالصفحات اليتيمة التي لا تشير إلى أي رابط ولا تخضع لأي رابط يشير إليها مما يجعل فهرستها صعبة.

قد يكون عدم وجود مثل هذه الروابط ناتجًا عن الجهل أو عدم الاهتمام بمبادئ الرؤية من جانب مؤلفي الصفحات.

لقد أتاحت أدوات الويب 2.0 الوصول إلى جميع تقنيات واستخدامات شبكة الويب العالمية الأولية من خلال إنشاء طرق اتصال وأدوات جديدة للمشاركة والتحدث على الويب.

أدت مساحة التنشئة الاجتماعية هذه إلى ظهور صفحات جديدة وأنواع جديدة من التبادلات التي تزيد من تعقيد البحث على الإنترنت.

وفقًا للمتخصص هوغو سوسي ، ستكون ثورة الإنترنت التالية هي الويب الدلالي أو الويب 3.0. يجب أن يوفر الويب الدلالي ، المرتبط بشبكة الويب اليوم ،

إمكانية تجميع العديد من البيانات المرتبطة معًا إما “دلاليًا” أو من خلال السمات التي تميزها.

لم يعد الأمر يتعلق باستعادة قوائم النتائج الأولية التي تم الحصول عليها من معايير البحث التي تمت صياغتها في شكل استعلامات في المحركات ،

ولكن إنتاج قائمة من المراجع المنظمة تسمح لنا بالرجوع إلى الوراء على الخيوط أو النتائج الأخرى التي نحثها على النزول إلى الهاوية من الويب. بعبارة أخرى ،

تعطي تقنيات الويب الدلالي معنى للبيانات التي يمكن الوصول إليها على الويب من أجل مشاركتها أو تجميعها بسهولة أكبر.

الويب الدلالي:

لذلك تقترح الويب الدلالي ربط المحتوى بشكل كبير والاستفادة من أجهزة الكمبيوتر ، من أجل تسهيل البحث وتنظيم المعرفة على الشبكة …

كما لو أن الويب أصبحت مكتبة عامة ضخمة جيدة التنظيم! للقيام بذلك ، نستخدم البيانات الوصفية ، أي وصف طبيعة المعلومات في المستند (إنشاء بيانات حول البيانات).

هناك شرط أساسي آخر وهو تنسيق شائع: اليوم ، تتم كتابة البيانات الوصفية بلغة تسمى owl ومشفرة بتنسيق rdf (إطار وصف الموارد) بحيث يمكن فهمها بواسطة جميع تطبيقات البحث في قواعد البيانات.

لذلك ، تجمع هذه التطبيقات الاستجابات من عدة مصادر مختلفة. وفقًا لتيم بيرنرز لي ، مخترع الويب:

وفقًا لـ فرونيك و أرمال توماس ، مهما كان بحثك ، فإن أدوات ويب 3.0 لن تسمح فقط للبشر بالتفاعل ،

بل ستوفر أيضًا تنظيمًا أفضل للوصول إلى الرواسب الهائلة من المعلومات الرقمية المتاحة عن طريق نمذجة مسار الدماغ البشري.

لا تزال غوغل، بوابة الويب لأكثر من 77 بالمائة من الفرنسيين ، تصنف المواقع المعروضة على صفحات النتائج وفقًا لشعبيتها. ومع ذلك ،

فقد فهم مطورو المحرك الفائدة من فهرسة المزيد والمزيد من البيانات والصفحات على شبكة الويب العميقة ومراعاة الدلالات عند البحث.

السابق
أزمات الوعي
التالي
دور شبكة الإنترنت