ناگفته‌هاي الگوريتم‌ گوگل در هدايت وب

ناگفته‌هاي الگوريتم‌ گوگل در هدايت وب | 02144050905

نویسنده: استیون لوی منبع: وایرد، فوریه 2010 ترجمه: کیومرث سلطانی اشاره: آیا می‌خواهید بدانید گوگل چه برنامه‌ای برای تغییر زندگی شما دارد؟ کافی است در یک صبح پنج‌شنبه به کنفرانس Ouagadougou‌ مراجعه‌كنيد. مکان این رویداد مانتين‌ويو در ايالت کالیفرنیا است؛ جایی که ساختمان‌های مرکزی قدرتمندترین شرکت اینترنتی دنیا قرار دارد. اتاقی که با تعدادی مهندس، مدیر ارشد و افراد اجرایی پر شده است كه سعی می‌کنند راه‌هايی پیدا کنند تا موتور جست‌وجوی‌ خود را از این نیز باهوش‌تر سازند.

  • کانال رسمی تلگرام سنادیتا
  • بهینه سازی و سئو طراحی سایت

ناگفته‌هاي الگوريتم‌ گوگل در هدايت وب

سه‌شنبه ۱۶ آذر ۱۳۹۵ | 00:00359 بازدید

نویسنده: استیون لوی منبع: وایرد، فوریه 2010 ترجمه: کیومرث سلطانی

اشاره:
آیا می‌خواهید بدانید گوگل چه برنامه‌ای برای تغییر زندگی شما دارد؟ کافی است در یک صبح پنج‌شنبه به کنفرانس Ouagadougou‌ مراجعه‌كنيد. مکان این رویداد مانتين‌ويو در ايالت کالیفرنیا است؛ جایی که ساختمان‌های مرکزی قدرتمندترین شرکت اینترنتی دنیا قرار دارد. اتاقی که با تعدادی مهندس، مدیر ارشد و افراد اجرایی پر شده است كه سعی می‌کنند راه‌هايی پیدا کنند تا موتور جست‌وجوی‌ خود را از این نیز باهوش‌تر سازند.

آیا می‌خواهید بدانید گوگل چه برنامه‌ای برای تغییر زندگی شما دارد؟ کافی است در یک صبح پنج‌شنبه به کنفرانس Ouagadougou‌ مراجعه‌كنيد. مکان این رویداد مانتين‌ويو در ايالت کالیفرنیا است؛ جایی که ساختمان‌های مرکزی قدرتمندترین شرکت اینترنتی دنیا قرار دارد. اتاقی که با تعدادی مهندس، مدیر ارشد و افراد اجرایی پر شده است كه سعی می‌کنند راه‌هايی پیدا کنند تا موتور جست‌وجوی‌ خود را از این نیز باهوش‌تر سازند. امسال نیز گوگل چند‌صد پیشرفت مختلف را در رابطه با الگوریتم استثنایی خود به انجام رسانده است که هر کدام آن‌ها از دل چنین جلسه‌هایی بیرون‌آمده‌اند. تصمیم‌هاي گرفته‌شده در جلسه‌های هفتگي افزایش کیفیت جست‌وجوی گوگل باعث شد، تا نتایج دریافتی کاربر از جست‌وجوی مورد‌نظرش دچار تغییرات مثبتی شود. به‌اين ترتیب، شما می‌توانید با استفاده از گوگل به دنبال هر چیزی بگردید. از پرینتر SF-775p گرفته تا پایتخت بورکینافاسو که اتفاقاً نام آن با نام کنفرانس یکی‌است. اودی‌مَنبر که از سال 2006 مسئولیت بخش‌جست‌وجوی گوگل را برعهده‌دارد، این پیشرفت‌ها را رهبری‌می‌کند. تغییرات احتمالی یک‌به‌یک معرفی‌شده و نتایج حاصل از آزمايش چندین ماهه آن‌ها در کشورهای مختلف و با زبان‌های گوناگون ارائه می‌شود. یک نمایشگر تغییرات نتایج حاصل از پرس و‌جوهای ساده را قبل و بعد از انجام تغییرات به‌صورت پهلو‌به‌پهلو نشان‌می‌دهد. بعد از ظاهر‌شدن یکی از مثال‌ها که جست‌‌و‌جویی برای عبارت quitar center wah-wah بود، مَنبر اعتراف کرد‌، این جست‌و‌جو را خود وی انجام داده‌است.

ممکن است فکر کنید، پس از یک دهه موفقیت تجاری و سلطه بر بازار جست‌و‌جو، گوگل می‌تواند هم اکنون راحت ‌وآسوده باشد. هر چه باشد آن‌ها ۶۵‌ درصد از بازار جست‌و‌جو را در اختیار خود‌ دارند و تنها شركتي هستند که نام‌ آن‌ها به عنوان معادلي براي فعل جست‌و‌جو به کار‌می‌‌رود. اما درست همان‌طور که گوگل حاضر نیست زمانش را به استراحت در کاخ چند میلیاردی‌اش بگذارند، رقیبانش نیز حاضر به واگذاری رقابت و قبول شکست نیستند. برای سال‌ها یکه تاز دره‌سیلیکون با استفاده از الگوریتم مرموز و البته همه فن‌حريف خود سعی‌کرده مأموریتش یعنی سازماندهی اطلاعات جهان را به انجام‌رساند. اما در عرض پنج‌سال گذشته بعضی از شركت‌ها فرض اولیه و اصلی گوگل را به چالش کشیده‌اند و آن قبول این حقیقت است که یک موتور جست‌وجوی واجد‌شرايط با استفاده از پیشرفت‌های‌فناورانه و بهبود مداوم می‌تواند هر پرس‌وجوی ممکنی را پاسخ دهد. يك ‌شبكه‌اجتماعي یکی از نخستين مواردی بود که چنین حمله‌ای را آغاز كرد.آن‌ها نشان دادند، بعضی از افراد ترجیح می‌دهند اطلاعات مورد نیاز خود را از دوستانشان دریافت کنند تا اين‌كه آن‌ها را از‌طریق فرمول ناشناخته‌ای پیدا‌كنند.


شبکه‌های اجتماعی دیگر نیز از طریق تجزيه‌و‌تحليل ‌کردن مداوم به‌روز‌رساني‌ها مفهومی را با‌عنوان جست‌و‌جوی بي‌درنگ معرفی كرد‌ه‌اند، راهي براي ورود به آخرين گفت‌وگو به محض اين‌كه باز مي‌شود. همچنین پیدا‌کردن رستوران‌، خشکشویی و پرستار‌ کودک از طریق انبوه رتبه‌بندی‌های انجام‌شده در yelp بسیار راحت‌تر از حالت عادی است. هیچ کدام از این سایت‌ها به تنهایی تهدیدي جدی برای گوگل نيستند، اما مجموعه آن‌ها باعث می‌شود تا آینده جست‌و‌جو بازتر‌شده و بازیگران بیشتری در آن حضور داشته باشند، یعنی حالتی که دیگر در آن یک موتور واحد سلطه بازار را در اختیار ندارد، بلکه مجموعه چندین سرویس مختلف نیازهای کاربران را بر‌طرف مي‌كند.


با وجود تمام این‌ها بزرگ‌ترین تهدید گوگل در فاصله ‌850‌ ‌‌مایلی شمال آن قرار دارد: بینگ، موتور جست‌و‌جوی جدید و تازه‌‌نفس مایکروسافت که در ژوئن ماه‌گذشته به بازار عرضه‌شد‌، با نامي كه اكتشاف را به ذهن مي‌آورد. بينگ از زمان آغاز به‌كار نظر مثبت منتقدان را به خود جلب کرده است؛ وال استریت ژورنال بینگ را «جذب‌کننده‌تر از گوگل» خواند. ظاهر جدید به همراه کمپین تبلیغاتی صد‌میلیون دلاری مایکروسافت را قادر ساخت تا در بازار ایالات متحده سهم هشت درصدی خود را به يازده درصد افزایش دهد. رقمی که در صورت اجازه قانون‌گذاران برای اين‌كه بینگ فراهم‌آورنده سرویس جست‌و‌جوی یاهو شود، به دو برابر افزایش خواهد یافت. بینگ روی نمونه‌هاي‌كميابي متمرکز شده که الگوريتم‌هاي گوگل نمی‌تواند همیشه پاسخ‌گوی آن‌هاباشد. به عنوان مثال، گوگل در زمینه جست‌و‌جو روی بخش عمومی وب عملکرد بسیار عالی‌ دارد، اما به داده‌هایی که به‌طور‌مرتب در حال تغییر هستند، مانند برنامه‌پروازها و کرایه‌مسافرها دسترسي لحظه‌اي ندارد. به‌همین دلیل، مایکروسافت Farecast را خریداری كرد و یافته‌های آن را در نتایج به دست آمده در جست‌و‌جوی بینگ گنجاند؛ سایتی که قیمت بلیت‌های خطوط‌هوایی را به صورت مرتب پی‌گیری کرده و با استفاده از این داده‌ها می‌تواند بالا یا پایین رفتن قیمت را پیش‌بینی كند. همچنین آن‌ها تصاحب‌های مشابهی را در زمینه مسائل بهداشتی، مراجع و بخش‌های مربوط به خرید انجام داده و به‌اين‌ترتيب وارد حوزه‌ای شدند که الگوریتم گوگل در آن عملکرد مناسبی نداشته است.

"سينگال‌: «‌ممکن است فکر کنید که الگوریتم گوگل چیزی کمی بیشتر از یک موتور جست‌و‌جو است، اما اگر کمی صبر‌کرده وبه‌عمق موضوع وارد شويد می‌بینید که این موجود چه کارهایی که انجام نمی‌دهد!»"

 

حتی خود سازندگان بینگ نیز اعتراف مي‌كنند که وقتی نوبت به انجام وظایف ساده مانند انجام جست‌و‌جو روی یک عبارت و برگرداندن نتیجه مرتبط می‌رسد، گوگل هنوز هم خیلی ازآن‌ها جلوتر است. اما آن‌ها معتقدند، که اگر بتوانند در چندین حوزه معدود بینگ را قوی سازند، مردم عادت خواهند‌کردند که برای پرس‌و‌جوهای مختلف از موتورهای جست‌و‌جوی گوناگون استفاده كنند. برایان‌مک‌دانلد، معاون مایکروسافت در زمینه جست‌و‌جو در این‌باره‌می‌گوید‌: «الگوریتم در جست‌و‌جو بسيارمهم است، اما مهم‌ترين مسئله نيست، شما یک ماشین رابا معياري فراتر از موتور آن مي‌خريد.»پاسخ گوگل می‌تواند در چهار کلمه به‌عنوان يك مثال خلاصه شود: «‌Mike Siwek Lawyer Mi.»


آمیت سينگال، این عبارت را در جعبه جست‌و‌جو تایپ‌می‌کند‌. سينگال مردی متشخص و چهل و اندی ساله که یک هواخواه گوگل يا Google Fellow‌ است. این عنوان چهار سال قبل و برای تقدیر از بازنویسی موتور جست‌و‌جو در سال 2001 به وی اهدا شد. او کلید Enter را می‌فشارد. در زمانی که بهترین معیار برای آن سرعت بال زدن مرغ‌ مگس‌خوار است، صفحه‌ای پر از لینک‌های‌مختلف ظاهر‌می‌شود. نتایج بالایی صفحه به وکیلی با نام مایکل سیوک در گرندرپیدز میشیگان مربوط می‌شود. این جمله به‌نظر جست‌و‌جوی ساده‌ای ‌می‌آید. چیزی مشابه همان‌هایی که گوگل روزانه میلیاردها نمونه از آن را مدیریت می‌کند، اما در واقع جست‌و‌جوی موردنظر به‌روش فریب دهنده‌ای پیچیده است. به‌عنوان‌مثال،‌ همین کلمات‌را در بینگ تایپ‌کرده و نتیجه را مشاهده كنيد. نخستين نتیجه صفحه‌ای درباره بازیکنان لیگ NFL است که شامل نام Lawyer‌ Milloy می‌شود. با‌وجود ظاهر‌شدن چندین صفحه در نتایج هیچ اشاره مستقیمی بهSiwek وجود ندارد.


این مقایسه نشان‌دهنده قدرت و حتی هوش بالای الگوریتم گوگل است که می‌تواند درخواست جست‌و‌جو کننده را حتی اگر به بدترین شکل ممکن تایپ شده‌باشد، تفسیركند. گوگل این توانایی را کیفیت جست‌و‌جو می‌نامد. فرآيندي که باعث می‌شود بتوان نتایج دقیق را برای جست‌و‌جو بازگرداند و برای سال‌های متمادی شركت به‌دقت از آن محافظت کرده است. اما حال من در ساختمان شماره 43 آن‌ها، یعنی همان‌جایی که‌گروه اصلی جست‌و‌جو کار می‌کند، در کنار سينگال نشسته‌ام، زیرا گوگل فرصت یک بازدید کلی از مجموعه و توضیح اجمالی شیوه کار الگوریتم را برای من فراهم كرده است. معناي‌ نهفته در اين جمله‌ها روشن و واضح است‌: «‌ممکن است فکر کنید که الگوریتم گوگل چیزی کمی بیشتر از یک موتور جست‌و‌جو است، اما اگر کمی صبر‌کرده وبه‌عمق موضوع وارد شويد می‌بینید که این موجود چه کارهایی که انجام نمی‌دهد!»

داستان الگوريتم‌هاي گوگل
ماجراي الگوریتم گوگل با Page‌Rank آغاز شد. سیستمی که لری‌پیج یکی از مؤسسان گوگل در سال 1997 زمانی که دانشجوی تحصیلات تکمیلی استنفورد بود، ابداع كرد. ایده پیج که هم اکنون به دیدگاهی افسانه‌ای تبدیل‌شده‌، رتبه‌بندی صفحه‌ها بر‌اساس تعداد و اهمیت لینک‌هایی بود که به سوی آن‌ها ارجاع داده بودند. این باعث می‌شد تا گنجینه‌ای هوشمند از وب به دست آمده و مرتبط‌ترین سایت‌ها مشخص شود. این مفهومی ساده و قدرتمند بود و با رشد گوگل و تبدیل آن به موفق‌ترین موتور جست‌و‌جوی وب، پیج و دیگر مؤسس گوگل سرگی‌برین این ایده را به اساس فعالیت شرکت تبدیل كردند.


اما این تمام داستان نيست. منبر می‌گوید‌: «مردم بیشتر در‌باره Page Rank‌ می‌دانند، زیرا اين سيستم بیشتر از بقیه ملموس ‌است، اما چیزهای بسیار دیگری نیز در بهبود رابط لینک‌های ظاهر‌شده در صفحه نتایج نقش داشتند.» از جمله می‌توان به بهره‌گیری از تعدادی سیگنال مشخص و سرنخ‌های مفهومی اشاره كرد که موتور جست‌و‌جو را قادر می‌ساختند تا میلیون‌ها جواب ممکن را برای یک پرس‌و‌جو مرتب کرده و بهترین‌ها را زودتر نمایش دهند.


جست‌وجوی وب فرآيندي چند مرحله‌ای است؛ در مرحله اول، گوگل وب را می‌کاود تا محتوای هر سایت قابل دسترسی را شناسایی‌كند. این داده‌ها به یک نمايه تبدیل‌می‌شوند (چیزی شبیه نمايه کتاب که بر‌اساس کلمه‌ها سازماندهی می‌شود) که‌ راهی برای پیدا‌کردن هر صفحه‌ای بر‌اساس محتوای درونی آن است. هر‌بار که کاربر یک پرسش را تایپ می‌کند، نمايه تمام صفحه‌های مرتبط را بر‌اساس آن نمايه باز می‌گرداند. این‌فهرست معمولاً شامل صدها هزار و حتی میلیون‌ها نتیجه است. نکته اصلی کار، رتبه‌بندی این صفحه‌ها است تا مشخص شود کدام یک باید بالاتر به نمایش در‌بیایند.


این همان زمانی است که سیگنال‌های مفهومی به میدان‌می‌آیند. تمام موتور‌های ست‌و‌جو چنین چیزهایی را به‌کار می‌گیرند، اما هیچ یک مانند گوگل نبوده‌اند. زیرا یا تا این اندازه سیگنال به موتور جست‌و‌جویشان اضافه نکرده‌ یا نتوانسته‌اند به این خوبی ازآن‌ها بهره‌گیرند. خود Page Rank نیز یک‌سیگنال است؛ يك‌ ویژگی‌ از یک صفحه وب(در ‌این‌مورد میزان اهمیت آن‌هابه‌نسبت بقیه وب) که می‌تواند برای تعیین میزان مرتبط بودن یک صفحه وب به‌‌کار رود. بعضی از سیگنال‌ها هم‌اکنون مشخص و واضح به‌نظر‌می‌رسند. از همان ابتدا گوگل اهمیت ویژه‌ای برای عنوان یک صفحه وب قائل می‌شد. روش مهم دیگر بهره‌گیری از Anchor text‌ است؛ یعنی کلماتی که برای توضیح یک لینک از صفحه‌ای‌به‌صفحه‌دیگر‌ظاهر‌می‌شوند. همان‌طور که اسکات‌حسن یکی از معماران اولیه گوگل که در استنفورد با پیج و برین کار می‌کرد، مي‌گويد: «‌در نتیجه این عمل وقتی شما جست‌و‌جو را انجام می‌دهید صفحه درست برایتان به نمایش در‌می‌آید. حتی اگر آن صفحه به‌طور دقیق کلماتی را که شما در جست‌و‌جوی‌تان به آن اشاره كرديد شامل نشود. این قابليت توانایی بسيار‌جالبی است.» سیگنال‌ها‌ي بعدي شامل مشخصه‌هايي مانند تازگی( درباره ‌پرس‌و‌جوهاي خاص صفحاتی که جدیدتر درست شده‌اند،به احتمال با ارزش‌تر از قدیمی‌ترها هستند) و مکان (گوگل موقعیت جغرافیایی شما را تشخیص داده و نتایج محلی را برجسته‌تر مي‌سازد) می‌شود. این موتور جست‌و‌جو هم اکنون از چیزی نزدیک به دويست سينگال برای رتبه‌بندی بهتر نتایج سود می‌برد.


مهندسان گوگل متوجه شدند که بسیاری از سیگنال‌های مهم می‌تواند از داخل خود گوگل برخیزد. Page Rank به‌عنوان معیاری برای ورود پوپولیسم به موتورهای جست‌و‌جو یاد می شود: دموکراسی تشکیل شده از میلیون‌ها انسان که تصمیم می‌گیرند به چه چیزهایی در وب‌لینک بدهند. اما سينگال اشاره می‌کند که مهندسان آن‌ها در ساختمان شماره 43 به نوع دیگری از دموکراسی دست‌یافته‌اند. صدها‌میلیون جست‌و‌جو روی گوگل، داده‌ای که‌هنگام جست‌و‌جوی افراد تولید می‌شود روی چه نتایجی کلیک‌می‌کنند، وقتی از پرس‌و‌جوي ‌خود نتیجه دلخواه را نمی‌گیرند، چه کلماتی را در داخل آن جایگزین می‌کنند، چگونه پرس‌و‌جو‌ها با مکان فیزیکی‌شان تطبیق می‌یابد و به منبعی ارزشمند برای کشف سیگنال‌های جدید و بهبود مرتبط‌بودن نتیجه تبدیل مي‌شود. مهم‌ترین مثال مستقیم این فرآيند چیزی است که گوگل آن را جست‌و‌جوی شخصی‌شده می‌نامد. یعنی ویژگی‌ای که با استفاده از تاریخچه جست‌و‌جوهای یک نفر و مکان وی سیگنال‌هایی را برای مشخص كردن نتایجی که برای آن فرد مفید است تعيين مي‌كند. به صورت عمومی‌تر، گوگل با استفاده از میزان فراوان داده‌ای که جمع‌آوری کرده‌است، می‌تواند الگوریتمش را با پایگاه دانش‌محور عمیقی مجهز سازد. به‌اين ترتيب، می‌تواند دشوارترين پرس‌و‌جو‌ها را نیز تفسیر كند. برای مثال روشی را که موتور جست‌و‌جوی گوگل به وسیله آن کلمات هم‌معنی را تشخیص‌می‌دهد، در‌نظر‌بگیرید. سينگال می‌گوید: «ما نكته‌هاي ریزی را از همان ابتدا کشف‌کردیم. مردم کلمات را در پرس‌‌و‌جوهایشان تغییر می‌دهند. یک نفر ممکن است ابتدا «‌pictures of dogs» و بعد از آن «pictures of puppies» را جست‌و‌جو كند.این به ما نشان می‌دهد که به‌احتمال dog و puppy به یک مفهوم هستند. ما همچنین یاد‌گرفتیم که وقتی شما آب را می‌جوشانید، آن آب داغ است. مادر‌حال باز‌آموزي معاني از انسان‌ها بوديم و این پیشرفت بزرگی است.»


اما در این میان مشکلاتی نیز وجود دارد. سیستم هم‌معنی‌شناسی گوگل می‌تواند بفهمد که dog شبیه puppy بوده و آب جوشان داغ است. اما در همين حال، نتیجه‌گیری می‌کند که هات‌داگ به‌معنای یک puppy جوشان است! این مشکل در اواخر سال 2002 به كمك ابداع خیره‌کننده‌ای بر‌طرف شد. این روش بر‌پایه تئوری لودویگ ویتگنشتاین فیلسوف بزرگ اتریشی درباره اين‌كه واژه‌ها‌ چگونه در داخل یک متن‌تعریف‌می‌شوند، بنا شده است. گوگل با کاوش در میلیاردها سند و صفحه وب تحلیل‌كرد که چه کلماتی به یکدیگر نزدیک هستند. هات‌داگ در جست‌و‌جوهایی یافت شد که شامل نان، خردل و بازی بیس بال نیز بودند. این به الگوریتم کمک کرد تا درک كند که هات داگ و میلیون‌ها اصطلاح دیگر در‌واقع به چه معنایی‌هستند.


سينگال می‌گوید: «‌امروز اگر شما تایپ کنید Gandhi bio ما می‌دانیم که منظور شما بیوگرافی است و اگر تایپ کنید bio warfare ما متوجه می‌شویم که منظورتان بیولوژیکال بوده است.» در طول زمان، گوگل راه‌های مختلفی را برای اضافه کردن سیگنال‌های بیشتر بدون این‌که تجربه اصلی کاربرانش را دچار مشکل سازد، وضع کرده است. هر چند سال یکبار تغییری اساسی در سیستم به وجود می‌آید که چیزی مانند عرضه نسخه جدید ویندوز محسوب مي‌شود. اين موضوع در مانتين ويو مسئله بسيار مهمي به‌شمار‌مي‌آيد، هر چند به‌طور عمومي مطرح نمي‌شود. سینگال می‌گوید: «کار ما در واقع تعویض موتور هواپیمایی است که با سرعت هزار کیلومتر در ساعت و در ارتفاع سي‌هزار‌پايي بالای زمین پرواز می‌کند.» در سال ۲۰۰۱ و با پیشروی خیره‌کننده وب، سینگال به‌طور عملي الگوریتم اصلی پیچ و برین را دچار تغییری اساسی ساخت تا به‌اين وسیله بتوان سیگنال‌های جدید را به سرعت در سیستم اضافه كرد (یکی از نخستين سیگنال‌های سیستم جدید تمایز بین صفحه‌های تجاری و غیرتجاری بود تا به‌اين‌ترتيب جست‌وجوکنندگانی که به دنبال خرید کردن هستند، نتایج بهتری دریافت کنند). در همان سال مهندسی با نام کریشنا بهارات متوجه شد که لینک های سایت های معتبر باید وزن بیشتری داشته باشند و به‌اين ترتیب سیگنالی قدرتمند را برای اعطای اعتبار بیشتر به مراجع سایت‌های خبره در نظر گرفت (این به اولین حق اختراع ثبت شده گوگل تبدیل شد). آخرین تغییر عمده سیستم که با اسم رمز کافئین شناخته می‌شود سیستم نمايه‌گذاری را به‌طور کلی دچار تغییر ساخت تا اضافه کردن سیگنال‌ها برای مهندسان از قبل نیز آسان‌تر شود.


گوگل به خلاقيت در زمينه انجام چنين تغييرات مهمي مشهور است. اين شركت هر سال نمایشگاه‌های دموی داخلی با عنوان CSI (‌سرنام Crazy Search Ideas‌) برگزار می‌كند که در آن تلاش می‌شود تا ایده‌های از نظر‌دور مانده، اما کارآمد مورد بررسی قرار‌گیرد. اما دربيشتر مواقع فرآيند توسعه به شکل دیگری دنبال می‌شود. گوگل سعی می‌کند با زیر و رو‌کردن نتایج بد درک کند که چه‌چیزی در این بین اشتباه عمل‌کرده است. سال‌ها قبل، یکی از جست‌و‌جوهاي موفق به افسانه‌ای تبدیل شد‌: زمانی در سال 2001، سينگال متوجه شد که کاربران وقتی نام Audrey fino را جست‌و‌جومي‌كنند، نتایج ضعیفی دریافت می‌کنند. گوگل در نتیجه این جست‌و‌جو تعدادی سایت ایتالیایی را بر‌می‌گرداند که آدری‌هپبرن (هنرپیشه مشهور) را تحسین می‌کردند( fino درزبان ایتالیایی به معنای مناسب و خوب است). سينگال مي‌گويد: «ما دريافتيم كه اين درواقع نام يك فرد است. ما خیلی ساده دارای هوش کافی در درون سیستم نبودیم.»


شکست ناشی از جست‌و‌جوی Audrey Fino باعث شد تا سينگال درخواستی‌ را برای بهبود شیوه برخورد سیستم با نام‌ها ارائه دهد که نزدیک به هشت درصد از تمام حجم جست‌و‌جوها را به خود اختصاص‌می‌دهند. برای این ‌کار او مجبور بود که از یک‌روش‌‌قوی شکستن bi-gram استفاده‌كند که به معنای شکستن کلمه‌ای چند قسمتی به اجزایی ساده‌تر است. به‌عنوان‌مثال، نیویورک از دو کلمه تشکیل‌شده‌است که همراه هم‌می‌آیند(bi-gram). همچنین نیویورک‌تایمز از سه کلمه تشکیل‌شده‌ که آن‌ها نیز همراه هم‌می‌‌آیند، اما معنای ‌آن‌ها با نیویورک‌ تنها به کلی‌متفاوت است و همه این‌ها وقتی کلمه به میدان نیویورک تایمز تبدیل می‌شود، تغییر می‌كند. انجام این تفکیک‌ها برای انسان امری به‌نسبت آسان است، اما گوگل از آن شركت‌هايي نيست كه در آن هزاران پارتيشن چوبي براي كارمندان خود درست كرده و متكي بر آن‌ها باشد. بلکه سعی دارد تا به جای انسان‌ها به الگوریتم‌ها تکیه كند. پرس و‌جوی مایک سیوک نشان داد، گوگل چگونه می‌تواند به این امر دست یابد. وقتی سينگال دستوری را تایپ کرد که کدتوليد شده برای هر جست‌و‌جو را نشان می‌داد، مشخص شد که چه سیگنال‌هایی موجب انتخاب لینک‌های بالایی می‌شوند. رابطه‌هایی که نشان می‌دهند مورد جست‌و‌جو اسم، هم معنی یا مکان جغرافیایی است. سينگال توضیح می دهد‌: «در واقع پرس‌و‌جو از نقطه نظر مهندسی شکسته می‌شود. به‌اين‌ترتیب معناي اولیه هر پرس و جو مشخص می‌شود.»


این واقعیتی بود که از دل موتور جست‌و‌جوی گوگل و داده‌های جمع‌آوری شده از جست‌و‌جوهای انجام شده در آن بر‌می‌خواست. Rock و Stone هر دو به معنای سنگ هستند. حتی اگر اولی را به صورت Rokc نیز بنویسید، هنوز منظورتان همان سنگ خواهد بود. اما اگر یک Little به آن اضافه‌كنيد آن‌وقت به Little Rock تبديل‌می‌شود که مرکز ایالت آرکانزاس‌است. سينگال معتقد است: «رمز موفقیت جست‌و‌جو این است که درک کنید کاربر چه‌چیزی می‌خواهد. آن وقت دیگر کلمات را تطابق نمی‌دهید، بلکه معانی را تطابق می‌دهید.» و گوگل به پیشرفت خود ادامه می‌دهد. به‌تازگي یکی از مهندسان جست‌و‌جوی گوگل با نام مورین هیمنز مشکلی را در‌رابطه با جست‌و‌جوی Cindy Louise Greenslade کشف‌كرد. الگوریتم می‌فهمید که باید دنبال یک شخص بگردد که در این مورد خاص یک روان‌شناس در گاردن گرو کالیفرنیا بود، اما نمی‌توانست صفحه شخصی گرین اسلید را در ده جست‌و‌جوی برتر نمایش دهد. هیمنز فهمید، دلیل اين‌كه گوگل صفحه شخصی گرین‌اسلید را كه نتیجه‌ای مرتبط است به پایین می‌فرستد، این است که وی تنها از نام میانی مخفف خود استفاده می‌کند و نه نام میانی کامل مثل آن‌چیزی که در جست‌و‌جو آمده است. هیمنز می‌گوید‌: «ما باید باهوش‌تر از این باشیم.‌» به اين‌ترتیب، وی سیگنالی را برای نگاه‌کردن نام مخفف میانی اضافه كرد و هم‌ اکنون صفحه شخصی گرین‌اسلید پنجمین نتیجه است.
پیشرفت‌های کلیدی در جست‌و‌جوی گوگل

الگوریتم جست‌و‌جوی گوگل همواره در حال بهبود است و به‌طور مداوم برای کسب نتایجی با کیفیت بالاتر بازبینی می‌شود. در جدول زير فهرستي از مهم‌ترین تغییرات انجام شده روی این الگوریتم را از زمان ظهور رتبه‌بندی صفحه‌ها مشاهده مي‌كنيد.

Backrub
(سپتامبر 1997) الگوریتم جدید
(آگوست ۲۰۰۱) تحلیل اتصال محلي
(فوريه2003) Fritz
(تابستان ۲۰۰۳) شخصي‌سازي ‌نتايج
(ژوئن2005) Bigdaddy
(دسامبر ۲۰۰۵) جست‌وجوی یونیورسال
(می ۲۰۰۷ ) جست‌وجو در لحظه
(دسامبر ۲۰۰۹)

موتور جست‌و‌جویی که برای نزدیک به دو سال روی سرورهای استنفورد اجرا می‌شد، نام خود را به گوگل تغییر داد. نوآوری اساسی آن ‌رتبه‌بندی صفحه‌ها بر‌اساس تعداد و کیفیت لینک‌های ارجاعی است.

 الگوریتم جست‌و‌جو به طور‌کلی مورد بازبینی قرار گرفت تا بتواند به راحتی از معیارهای الحاقی رتبه‌بندی سود برد.

 نخستين حق اختراع گوگل در این رابطه ثبت شد. این ویژگی وزن بیشتری را به لینک‌های موجود در
سایت‌های معتبر اختصاص می‌دهد.

 این ابتکار به گوگل امکان داد تا بتواند به‌جای به‌روزرساني‌هاي بزرگ دسته‌ای، نمايه خود را به صورت مرتب به‌روز كند.

 کاربران می‌توانند گوگل را طوری تنظیم كنند که بتواند رفتار جست‌و‌جوی مورد‌نظر آن‌ها را پیاده‌سازی‌كند. با این کار نتایج مخصوص هر نفر می‌تواند حاصل شود.

 به روز رسانی موتور باعث شد تا گوگل بتواند جست‌و‌جویی مفهومی‌تر را در وب انجام دهد.

 قابليت جست‌و‌جوي فراگير ( Universal Search) كه بر پايه قابليت‌هاي جست‌و‌جوي تصاوير، اخبار و كتاب شركت گوگل ساخته شده است، کاربر را قادر می‌سازد تا لینک مورد ‌نظر خود را در‌ هر رسانه‌اي در یک صفحه نتایج واحد مشاهده كند.

 

نمایش نتایج از شبکه‌های اجتماعی
و‌بلاگ‌ها پس از انتشار آن‌ها.

 

 

در هر زمانی چندین نمونه از این تغییرات در یک فرآيند آزمايش دقیق قرار می‌گیرند. گوگل صدها نفر را در سرتاسر دنیا استخدام کرده‌ است که در خانه‌هایشان نشسته و نتایج جست‌و‌جوهای مختلف را ارزیابی می‌كنند. به‌اين‌ترتيب، مشخص می‌شود که آیا تغییرات باعث بهبود نتایج شده‌اند یا آن‌هارا بدتر کرده‌اند. اما در واقع گوگل دارای یک ارتش بزرگ از آزمايش‌کننده‌ها است. میلیاردها کاربری که به صورت مجازی هر کدام از آن‌ها در حال شرکت‌مداوم در آزمايش‌کیفیت نتایج جست‌و‌جوها هستند. هر زمان که مهندسان تصمیم به امتحان یک تغییر می‌گیرند، ابتدا آن را روی درصد کوچکی از کاربران که به صورت تصادفی انتخاب شده‌اند، اعمال کرده و بقیه جست‌و‌جوکنندگان را به عنوان گروه کنترل در نظر‌می‌گیرند. با توجه به اين‌كه تعداد تغییراتی که باید آزمايش‌شوند، بسیار زیاد است گوگل از این روش علمی سنتی که در هر زمان تنها یک آزمایش باید صورت گیرد تبعیت نمی‌کند.


پاتریک رایلی مهندس کیفیت جست‌و‌جو در این‌باره می‌گوید: «تقریباً در بيشتر جست‌و‌جو‌های گوگل، شما در چندین گروه کنترل و آزمایش به صورت همزمان قرار دارید.» وي ادامه می‌دهد:«‌در‌اصل، تمام پرس‌و‌جو‌ها به نوعی درگیر یک آزمايش هستند.» به بیان دیگر، هر وقت در حال جست‌و‌جو روی گوگل هستید، از شما به عنوان یک موش آزمایشگاهی استفاده می‌شود.


انعطاف‌پذیری، یعنی توانایی اضافه‌کردن سیگنال‌ها، تغییر کد زیرین و آزمايش‌ مرتب نتایج، دلیلی است که گوگلی‌ها با آن ادعا می‌کنند درهر گونه رقابتی از جانب بینگ یا شبکه‌های اجتماعی موفق خواهند بود‌. در واقع در عرض شش‌ماه گذشته بیش از دويست تغییر را در سیستم آن‌ها ایجاد کرده‌ که بعضی ازآن‌ها تقلیدی از رقبا است (‌گوگل می‌گوید، این تنها یک حادثه بوده است وآن‌ها مرتب هرساله ویژگی‌هایی را به سیستم اضافه می‌کنند).


یکی از این‌موارد سیستم جست‌و‌جوی بي‌درنگ است‌که پس از گفته چند ماه قبل لری پیج در رابطه با اين‌كه گوگل باید بتواند تمام وب را در هر ثانیه اسکن كند، به مرحله اجرا درآمد. وقتی یک نفر جست‌و‌جوی مورد نظرش را در گوگل تایپ می‌کند، در کنار ده لینک آبی رنگ صفحه نخست گوگل یک جعبه با عنوان Latest Results نیز اضافه‌کرده است که در آن مجموعه‌ای از پست‌های تازه ارسال‌شده توسط منابع‌خبری، وبلاگ‌ها یا شبکه‌های اجتماعی را به نمایش در می‌آورد.


در این‌‌موارد نیز گوگل با استفاده از سیگنال‌ها مطمئن می‌شود که تنها مرتبط‌ترین موارد به نمایش در می‌آیند. سينگال می‌گوید: «ما به‌موارد مختلفی مانند توجه افراد به آن پست یا تولید شدن آن توسط انسان یا ماشين توجه می‌کنیم و ادامه می‌دهد این کاری است که می‌دانیم چگونه انجامش دهیم، زیرا برای یک دهه آن را به بهترین نحو اجرا کرده‌ایم.»


همراه با جست‌و‌جوی در لحظه، گوگل ویژگی‌های جدید دیگری را نیز ‌معرفی‌كرده‌است. از جمله سرویسی به نام Goggles که با تصاویر گرفته‌شده توسط دوربین کاربران مانند پرس و جوهای جست‌و‌جورفتار مي‌كنند. تمام این‌ها بخشی از حرکت بدون توقف شركت برای حضور همیشگی و تمام و کمال جست‌و جو برای کاربران است. با دوربین و توانایی تشخیص صدا، اسمارت‌فون‌های امروزی به چشم و گوش تبدیل‌شده‌اند. اگر سیگنال درست پیدا شود، هر چیزی می‌تواند درقالب پرس و‌جوها دسته‌بندی شود.

تنها گوگل مي‌داند
قدرت محاسباتی و پهنای باند بالای گوگل به شركت برتری غیر‌قابل‌انکاري هدیه‌کرده‌است. بعضی از کارشناسان بازار می‌گویند، این همان مزیتی است که باعث می‌شود شرکت‌های تازه وارد امکان رقابت را از دست بدهند، اما منبر می‌گوید: «‌‌فقط زیرساخت نيست‌که گوگل را رهبر بازار ساخته، بلکه‌ مهم‌ترین و اساسی‌ترین عامل تمام این مسائل استخدام افراد مناسب است.»

شكل 1- اودی مَنبر شكل 2- آمیت سینگال

 

از تمام جهات کی‌لو یکی از این افراد محسوب می‌شود. منبر که با این دانشمند 48 ساله علوم کامپیوتر در یاهو نیز همکار بوده است، در‌مورد وی می گوید: «من بیشترین احترام را برای وی قائلم.» اما لودوسال قبل گوگل را به مقصد مایکروسافت ترک‌ كرد تا رهبری تیم بینگ را بر‌عهده‌گیرد. وقتی از او درباره مأموریتش سؤال می‌شود، لو ریز‌اندام که شلوار جین و تی‌شرت بینگ را به‌تن دارد، با مکث کوتاهی جواب می‌دهد، بسیار مهم است که به یاد داشته باشیم، این سفری طولانی‌مدت است. نگاهی در چشمان لو وجود دارد که فریاد می‌زند، من از اینجا نخواهم رفت. چیزی مشابه نگاه اوما ترمن در فیلم بيل را بكش.»


در واقع، شركتي که جنگ مرورگرها را در دهه گذشته به سود خود پایان داد، سعی می‌کند تا بهترین عملکرد ممکن را ارائه دهد. همراه با قطعیتی که در نهايت در یک‌زمان مردم نیازهایی فراتر از آن چیزی که الگوریتم گوگل برایشان فراهم می‌کند، پیدا خواهند كرد. هری شوم مسئول بخش توسعه جست‌و‌جو در مایکروسافت در این‌باره می‌گوید: «‌اگر‌تغییری در پارادایم ایجاد نشود، رقابت با رهبران فعلی بسیار دشوار خواهد بود.» و ادامه می‌دهد: «اما از دید ما چنین تغییر پارادایمی رخ خواهد داد.» با این حال حتی در صورتی که چنین تغییری پیش‌آید، به‌احتمال الگوریتم گوگل نیز می‌تواند با آن هماهنگ شود.


به همین دلیل است که گوگل رقیب ترسناکی محسوب می‌شود. آن‌ها ماشینی تا آن حد قدرتمند ساخته‌اند که بتواند هر‌تهدیدی را از جانب رقبا از خود دور‌كند.تمام این‌ها با بازگرداندن نتیجه‌ای با کیفیت بالا همراه می‌شود که از عهده رقبا بر‌نمی‌آید. هرفردي می‌تواند ایده‌ای جديد را برای یک روش جدید خرید بلیت هواپیما ارائه دهد. اما فقط گوگل است که می‌داند چگونه مایک سیوک را پیدا كند.

 

منبع : مجله شبکه

 


دیدگاه خود را بیان کنید
خدمات طراحی سایت سنادیتا
  • طراحی سایت شرکتی
  • طراحی سایت صرافی
  • طراحی سایت صنعتی
  • طراحی سایت علمی
  • طراحی سایت فروش شارژ
  • طراحی سایت فروش فایل
  • طراحی سایت فروشگاهی
  • طراحی سایت فیلم و موزیک
  • طراحی سایت هنری
  • طراحی سایت واکنش گرا
  • طراحی سایت تفریحی و بازی آنلاین

 

  • طراحی سایت کارخانجات
  • طراحی سایت کودکان
  • طراحی سایت گالری
  • طراحی سایت گردشگری
  • طراحی سایت لباس و کیف و کفش
  • طراحی سایت مجله اینترنتی
  • طراحی سایت مدرسه
  • طراحی سایت مراکز تجاری
  • طراحی سایت مرتبط با حیوانات
  • طراحی سایت نمایشگاهی
  • طراحی سایت هتل و اماکن اقامتی
  • طراحی سایت تبلیغاتی

 

RSS

آرشیو

بازدید روز

۵۴۸

بازدید دیروز

۴۵۵۸

بازدید ماه

۷۶۲۳۴

بازدید کل

۱۶۴۹۷۱۱

افراد آنلاین

۳

نام سايت: sanadata.com
الکسای جهانی :۱۴۱۸۸۶
میزان تغیرات :+۲۲۴۰۰
الکسای ایران :۳۳۶۱

1  
2 A B C
3 D E F
4 G H I
5 J K L
5 J K L
6 M N O
7 P Q R S
8 T U V
9 W X Y Z
*
0 +
0 +
0 +
0 +
#

آدرس دفتر مركزی :

تهران - فلکه دوم صادقیه - ابتدای خیابان آیت ا... کاشانی - جنب درمانگاه ابن سینا - مجتمع سبحان - طبقه 6 - واحد 33

ساعت کار شرکت از ساعت 9 الی 17

واحد فروش - خانم راد :     02144050905

واحد آموزش - خانم لطفی  :     02144048747

کلیه حقوق مادی و معنوی این وب سایت برای شرکت سنارایانه یکتا محفوظ می باشد.