גוגל מודה בבעיה בסריקת הרשת העמוקה

גוגל נתקלת בבעיות לא צפויות בחיפוש הסמנטי שלה ומידע נוסף על הרשת העמוקה, היא ה-Deep Web.

פרופסור אלון הלוי, שמוביל את צוות סריקת הרשת העמוקה מודה ש"לגוגל יש בעיות בסריקת מבני נתונים" וכשהוא מדבר על מבני נתונים הוא מתכוון לרשת העמוקה.
הרשת העמוקה או Deep Web הוא כינוי למאגרי נתונים ודפים שניתן להכנס ולסרוק אותם רק באמצעות שימוש בטפסים, סיסמאות או מנגנוני ניווט אחרים ושאינם יכולים להכנס לאינדקס על ידי סריקת קישורים.

על פי הלוי, בעוד שברשת האינטרנט הרגילה (או הרדודה) יש 5 מיליארד דפי אינטרנט, ייתכן שברשת האינטרנט העמוקה ישנה כמות דפים גדולה יותר פי 500 (!!!) גוגל סורקת כיום את הרשת העמוקה בעזרת מנגנון חיפוש במאגרי מידע שאינו כל כך יעיל. דרך נוספת ויעילה הרבה יותר לחקור את הרשת העמוקה היא באמצעות חיפוש סמנטי.

גוגל מנסה מגוון של שיטות חיפוש על מנת להתמודד עם הבעיה של הרשת העמוקה. ייתכן שהפתרון לא מצוי בשיפור מנוע החיפוש הנוכחי אלא בבניית שיטת חיפוש חדשה לגמרי. כאמור הלוי מוביל צוות של מומחים שמנסה ובוחן מגוון שיטות. יאהו! שהיא המתחרה הגדולה ביותר של גוגל (לפחות בחו"ל, בארץ כמעט ולא משתמשים במנוע החיפוש הזה שמתקשה להביא תוצאות מדויקות בעברית) גם נמצאת במירוץ לפיתוח כלי לחיפוש ברשת העמוקה והיא אף מקדימה את גוגל כיוון שהיא אוחזת ב-Search Monkey שהוא מנוע חיפוש סמנטי מתקדם שכבר נמצא בשימוש.

פוסטים נוספים שכדאי לקרוא

פתרונות ומאמרים על פיתוח אינטרנט

לא פרצו לנו, רק דלף לנו – לקחים טכניים מפרשת אלקטור

פסק הדין בפרשת תביעת של הדיבה אלקטור הוא קריאת השכמה טכנולוגית ומשפטית: מההגדרה המשפטית ל"פריצה", דרך החשיבות הקריטית של פרוטוקול ביעור נתונים אמיתי, ועד למה שבאמת קורה כשמערכות אבטחה מסתמכות על לוגים חסרים.

פתרונות ומאמרים על פיתוח אינטרנט

Retry decorator בפייתון

לא מזמן יצא לי לכתוב קוד בפייתון. הקוד משתמש ב-API של openAI ולפעמים ה-API הזה קצת מפשל. הוא מחזיר לי שגיאה ואומר שהגזמתי עם הקריאות,

פתרונות ומאמרים על פיתוח אינטרנט

גישת Least Privilege

גישה לכתיבת קוד מאובטח שכדאי מאד להכיר – במיוחד בעידן הבינה המלאכותית

בינה מלאכותית

Agent skills

איך בדיוק הוראות כלליות ופרטניות עובדות בסביבת אייג׳נט? נדגים עם קורסור ונציץ גם מאחורי הקלעים של הנטוורק.

פתרונות ומאמרים על פיתוח אינטרנט

מדרך מעשי לכתיבת קוד עם AI Agents

טכניקות בדוקות שנבדקו במוצרים אמיתיים לכתוב קוד טוב יותר עם LLM Agent. פוסט מיוחד למתכנתים מנוסים.

גלילה לראש העמוד