Cara Menggunakan Alat Pemapar Ngram dalam Buku Google

Isi kandungan:

Cara Menggunakan Alat Pemapar Ngram dalam Buku Google
Cara Menggunakan Alat Pemapar Ngram dalam Buku Google
Anonim

Apa yang Perlu Diketahui

  • Dalam Google Books Ngram Viewer, taip frasa, pilih julat tarikh dan korpus, tetapkan tahap pelicinan dan klik Cari banyak buku.
  • Anda boleh menelusuri data. Contohnya, untuk mencari bentuk kata kerja ikan, bukannya kata nama ikan, gunakan teg: cari fish_VERB.
  • Ngram Viewer mengeluarkan graf yang mewakili penggunaan frasa sepanjang masa. Untuk berbilang frasa, setiap satu diwakili oleh garis berkod warna.

Artikel ini menerangkan cara menggunakan alat Ngram Viewer dalam Buku Google untuk menjalankan penyelidikan dan carian kuasa.

Image
Image

Cara Pemapar Ngram Berfungsi

An Ngram, juga dipanggil N-gram, ialah analisis statistik kandungan teks atau pertuturan untuk mencari n (nombor) sesuatu jenis item dalam teks.

Item carian boleh terdiri daripada pelbagai perkara, termasuk fonem, awalan, frasa dan huruf. Walaupun Ngram tidak jelas di luar komuniti penyelidikan, ia digunakan dalam pelbagai bidang dan mempunyai banyak implikasi untuk pembangun yang mengekod program komputer yang memahami dan bertindak balas terhadap bahasa pertuturan semula jadi.

Dalam kes Google Books Ngram Viewer, teks yang akan dianalisis berasal daripada sejumlah besar buku dalam domain awam yang Google imbas untuk mengisi enjin carian Buku Googlenya. Untuk Google Books Ngram Viewer, Google merujuk kepada badan teks yang akan anda cari sebagai korpus. Ngram Viewer mengagregat mengikut bahasa, walaupun anda boleh menganalisis secara berasingan Bahasa Inggeris British dan Amerika atau menggabungkannya secara berasingan.

  1. Pergi ke Google Books Ngram Viewer di books.google.com/ngrams.
  2. Taip mana-mana frasa atau frasa yang anda ingin analisis. Pisahkan setiap frasa dengan koma. Google mencadangkan, "Albert Einstein, Sherlock Holmes, Frankenstein" untuk membantu anda bermula.

    Dalam carian NGram Viewer, item adalah sensitif huruf besar-besaran, tidak seperti dalam carian web Google.

  3. Pilih julat tarikh. Lalai ialah 1800 hingga 2000.
  4. Pilih korpus. Anda boleh mencari teks bahasa asing atau teks Inggeris, dan sebagai tambahan kepada pilihan standard, anda mungkin melihat entri seperti "English (2009)" atau "American English (2009)" di bahagian bawah senarai. Ini adalah korpora lama yang telah dikemas kini oleh Google, tetapi anda mungkin mempunyai beberapa sebab untuk membuat perbandingan anda terhadap set data lama. Kebanyakan pengguna boleh mengabaikannya dan menumpukan pada korpora terkini.
  5. Tetapkan tahap pelicinan. Kelicinan merujuk kepada kelicinan graf pada penghujungnya. Perwakilan yang paling tepat menggambarkan tahap pelicinan 0, tetapi tetapan itu mungkin sukar dibaca. Lalai ditetapkan kepada 3. Dalam kebanyakan kes, anda tidak perlu melaraskannya.

  6. Tekan Cari banyak buku.

Menggunakan Ngram Viewer Google, anda boleh menelusuri data. Jika anda ingin mencari kata kerja fish dan bukannya kata nama fish, anda boleh melakukannya dengan menggunakan tag. Dalam kes ini, anda akan mencari fish_VERB.

Google menyediakan senarai lengkap arahan dokumentasi lanjutan lain untuk digunakan dengan Ngram Viewer di tapak webnya.

Barisan Bawah

Google Books Ngram Viewer mengeluarkan graf yang mewakili penggunaan frasa tertentu dalam buku melalui masa. Jika anda memasukkan lebih daripada satu perkataan atau frasa, setiap satu diwakili oleh garis berkod warna untuk membezakan dengan istilah carian yang lain. Ini serupa dengan Google Trends, hanya carian meliputi tempoh yang lebih lama.

Kajian Kes

Pertimbangkan kajian kes pai cuka. Mereka disebut dalam siri Rumah Kecil Laura Ingalls Wilder di Prairie. Meneroka dengan carian web Google untuk mengetahui lebih lanjut tentang pai cuka mendedahkan bahawa pai itu dianggap sebahagian daripada masakan Amerika Selatan dan sememangnya dibuat dengan cuka. Mereka mendengar kembali masa ketika tidak semua orang mempunyai akses kepada hasil segar pada setiap masa sepanjang tahun tetapi adakah itu cerita keseluruhannya?

Cari Google Ngram Viewer untuk pai cuka, dan anda akan menemui beberapa sebutan tentang pai itu pada awal dan akhir 1800-an, banyak sebutan pada tahun 1940-an dan semakin banyak sebutan sejak kebelakangan ini. Walau bagaimanapun, dengan tahap kelicinan 3, anda melihat dataran tinggi di atas sebutan pada tahun 1800-an. Kerana tidak banyak buku yang diterbitkan pada masa itu dan kerana data ditetapkan untuk lancar, gambar diherotkan. Mungkin hanya satu buku yang menyebut pai cuka, dan ia dipuratakan untuk mengelakkan lonjakan. Dengan menetapkan pelicinan kepada 0, anda boleh melihat bahawa ini adalah tepat. Lonjakan itu berpusat pada 1869, dan terdapat satu lagi lonjakan pada tahun 1897 dan 1900.

Mungkin tiada siapa yang bercakap tentang pai cuka sepanjang masa: Mungkin terdapat resipi yang terapung di merata tempat, tetapi orang ramai tidak menulis tentangnya dalam buku, dan itu merupakan had penting bagi carian Ngram.

Disyorkan: