نحوه استفاده از ابزار Ngram Viewer در Google Books

Ngram، همچنین معمولا N-gram نامیده می شود، تجزیه و تحلیل آماری از محتوای متن یا گفتار است برای پیدا کردن n (یک عدد) از نوعی از آیتم در متن. این می تواند انواع مختلفی از چیزهایی مانند فون ها، پیشوند ها، عبارات، یا حروف باشد. گرچه N-gram در خارج از محقق تا حدودی مبهم است، اما در واقع در زمینه های مختلف استفاده می شود و برای افرادی که برنامه های کامپیوتری را درک می کنند و با زبان طبیعی صحبت می کنند، پیامدهای فراوانی دارد. به طور خلاصه، علاقه Google به این ایده است.

در مورد Google Books Ngram Viewer، متن مورد بررسی قرار میگیرد که از مجموعهای گسترده از کتابهای گوگل در کتابخانههای عمومی اسکن شده است تا موتور جستجوی Google Books خود را پر کنند. برای Google Books Ngram Viewer، آنها به متن شما میپردازند که به عنوان "corpus" جستجو میشوند. فاعلی در Ngram Viewer از نظر زبان تقسیم شده است، اگر چه شما می توانید به طور جداگانه انگلیس و آمریکایی انگلیسی را تجزیه و تحلیل کنید یا آنها را با هم ترکیب کنید. به نظر می رسد فوق العاده جالب است که از اصطلاحات انگلیسی و آمریکایی استفاده شود و تغییرات نمودار را مشاهده کنید.

چگونه Ngram کار می کند

  1. به Google Books Ngram Viewer بروید در books.google.com/ngrams.
  2. بر خلاف جستجوهای وب گوگل، اقلام حساس به حروف حساس هستند، بنابراین مطمئن شوید که اسم های خاصی را می گیرید.
  3. هر عبارت یا عبارتی که می خواهید تجزیه و تحلیل کنید را تایپ کنید. اطمینان حاصل کنید که هر حرف را با کاما جدا کنید. گوگل پیشنهاد می کند، "آلبرت انیشتین، شرلوک هلمز، فرانکشتاین" برای شروع کار شما.
  4. بعد، در یک محدوده تاریخی تایپ کنید پیش فرض 1800 تا 2000 است، اما کتاب های جدیدتری وجود دارد (2011 جدیدترین لیست شده در اسناد گوگل است، اما ممکن است تغییر کند.)
  5. یک جسم را انتخاب کنید شما می توانید متون زبان خارجی یا انگلیسی را جستجو کنید و علاوه بر انتخاب های استاندارد، ممکن است موارد زیر مانند "انگلیسی (2009) یا انگلیسی آمریکایی (2009)" را در پایین ببینید. این شرکتها قدیمی هستند که Google از آن زمان به روزرسانی کرده است، اما ممکن است دلیلی برای مقایسه شما با مجموعه داده های قدیمی داشته باشد. اکثر کاربران می توانند آنها را نادیده بگیرند و بر آخرین موجودات تمرکز کنند.
  6. سطح صاف خود را تنظیم کنید. صاف کردن اشاره به چگونگی صاف گراف در پایان است. دقیق ترین نمایش یک سطح صاف از 0 است، اما ممکن است خواندن آن دشوار باشد. پیش فرض به 3 تنظیم شده است. در اکثر موارد، شما نیازی به تنظیم آن ندارید.
  1. دکمه جستجوی بسیاری از کتاب ها را فشار دهید. (شما همچنین می توانید در جستجوی سریع وارد کنید.)

نمایش Ngram چیست؟

Google Books Ngram Viewer یک نمودار را نمایش می دهد که نشان دهنده استفاده از یک جمله خاص در کتاب ها از طریق زمان است. اگر شما بیش از یک کلمه یا عبارت را وارد کرده باشید، خطوط رنگی را برای مخلوط کردن شرایط جستجوی مختلف خواهید دید. این بسیار شبیه به Google Trends است ، فقط جستجو طولانی تر از زمان است.

در اینجا نمونه ای از زندگی واقعی است. ما اخیرا درباره کیک سرکه کنجکاویم. آنها در خانه کوچکی لورا ایگالز وایلدر در سری پریری ذکر شده است، اما ما هرگز از چنین چیزی شنیده ایم. ما برای اولین بار از جستجوی وب گوگل برای کسب اطلاعات بیشتر در مورد سرکه سرکه استفاده کردیم. ظاهرا، آنها بخشی از غذاهای آمریکای جنوبی هستند و واقعا از سرکه ساخته شده اند. آنها به زمان هایی گوش می دهند که همه افراد در تمام طول سال به محصولات تازه دسترسی نداشته باشند. آیا این همه داستان است؟

ما Google Ngram Viewer را جستجو کردیم و در اوائل و اواخر دهه 1800 اشاره ای به این پای وجود داشت که در دهه 1940 بسیار اشاره شد و تعداد زیادی از موارد اشاره شده در زمان های اخیر (شاید برخی از نوستالژی ها). خوب، برخی مشکل در داده ها در سطح صاف 3 است. در 1800s ذکر شده است. مطمئنا تعداد قابل توجهی از موارد ذکر شده در یک سالن به طور خاص در هر سال برای پنج سال وجود ندارد؟ آنچه اتفاق می افتد این است که به دلیل اینکه تعداد زیادی کتاب در آن زمان منتشر نشده است و به دلیل اینکه داده های ما صاف است، تصویر را تحریف می کند. احتمالا یک کتاب وجود داشت که سرکه سرکه را ذکر کرده بود و برای مقابله با یک سنبله فقط به طور میانگین بود. با تنظیم صاف کردن به 0، می توانیم ببینیم که این دقیقا مورد است. مراکز سنبله در سال 1869، و دیگری در سالهای 1897 و 1900 وجود دارد.

آیا هیچ کس در مورد سرکه سر و صدای دیگر بقیه صحبت نمی کند؟ آنها احتمالا در مورد آن کیک صحبت کردند. دستورالعمل های احتمالی شناخته شده بود. آنها فقط در مورد آنها در کتاب ها نوشتند، و این محدودیتی است از این جستجوهای Ngram.

جستجوی پیشرفته Ngram

به یاد داشته باشید که چگونه ما گفتیم Ngrams می تواند شامل انواع جستجوهای متنی مختلف باشد؟ گوگل به شما اجازه می دهد تا کمی با Ngram Viewer تمرین کنید. اگر میخواهید ماهی را به عنوان ماهی جستجو کنید، اسم آن را میتوانید با استفاده از برچسبها انجام دهید. در این مورد، شما برای fish_VERB جستجو کردید

گوگل لیست کاملی از فرمان هایی را که می توانید استفاده کنید و دیگر مستندات پیشرفته در وب سایت خود را فراهم می کند.