Apakah Pengecaman Aksara Optik (OCR)?

Isi kandungan:

Apakah Pengecaman Aksara Optik (OCR)?
Apakah Pengecaman Aksara Optik (OCR)?
Anonim

Optical Character Recognition (OCR) merujuk kepada perisian yang mencipta versi digital dokumen bercetak, ditaip atau tulisan tangan yang boleh dibaca oleh komputer tanpa perlu menaip atau memasukkan teks secara manual. OCR biasanya digunakan pada dokumen yang diimbas dalam format PDF, tetapi juga boleh membuat versi teks yang boleh dibaca komputer dalam fail imej.

Apa Itu OCR

OCR, juga dirujuk sebagai pengecaman teks, ialah teknologi perisian yang mengubah aksara seperti nombor, huruf dan tanda baca (juga dipanggil glyph) daripada dokumen bercetak atau bertulis ke dalam bentuk elektronik yang lebih mudah dikenali dan dibaca oleh komputer dan program perisian lain. Sesetengah program OCR melakukan ini kerana dokumen diimbas atau difoto dengan kamera digital dan yang lain boleh menggunakan proses ini pada dokumen yang telah diimbas atau difoto sebelum ini tanpa OCR. OCR membolehkan pengguna mencari dalam dokumen PDF, mengedit teks dan memformat semula dokumen.

Image
Image
Mengimbas akhbar bersejarah dengan perisian OCR.

Imej Getty

Untuk Apa OCR Digunakan?

Untuk keperluan pengimbasan yang pantas setiap hari, OCR mungkin bukan masalah besar. Jika anda melakukan banyak pengimbasan, dapat mencari dalam PDF untuk mencari yang tepat yang anda perlukan boleh menjimatkan sedikit masa dan menjadikan fungsi OCR dalam program pengimbas anda lebih penting. Berikut ialah beberapa perkara lain yang membantu OCR:

  • Pemprosesan data dan kemasukan data automatik (Contoh: Sistem penjejakan pemohon kerja untuk resume).
  • Menjadikan buku yang diimbas boleh dicari.
  • Menukar imbasan tulisan tangan kepada teks yang boleh dibaca komputer.
  • Menjadikan dokumen lebih boleh digunakan oleh program pembaca yang membantu pengguna cacat penglihatan.
  • Memelihara dokumen dan surat khabar bersejarah, sambil menjadikannya boleh dicari.
  • Pengekstrakan data dan pemindahan ke program perakaunan (Contoh: Resit dan invois).
  • Mengindeks dokumen untuk digunakan oleh enjin carian.
  • Pengiktirafan plat lesen pemandu oleh kamera kelajuan dan perisian kamera lampu merah.
  • Pensintesis pertuturan untuk orang yang tidak boleh bercakap – ahli fizik teori, Stephen Hawking, mungkin merupakan pengguna program pensintesis pertuturan yang paling terkenal.

Barisan Bawah

Kenapa tidak ambil gambar sahaja, bukan? Kerana anda tidak akan dapat mengedit apa-apa atau mencari teks kerana ia hanya akan menjadi imej. Mengimbas dokumen dan menjalankan perisian OCR boleh menukar fail itu menjadi sesuatu yang boleh anda edit dan boleh cari.

Sejarah OCR

Walaupun penggunaan pengecaman teks yang terawal bermula pada 1914, perkembangan meluas dan penggunaan teknologi berkaitan OCR bermula dengan sungguh-sungguh pada tahun 1950-an, khususnya dengan penciptaan fon yang sangat ringkas yang lebih mudah untuk ditukar kepada digital- teks yang boleh dibaca. Fon pertama yang dipermudahkan ini dicipta oleh David Shepard dan biasanya dikenali sebagai OCR-7B. OCR-7B masih digunakan hari ini dalam industri kewangan untuk fon standard yang digunakan pada kad kredit dan kad debit. Pada tahun 1960-an, perkhidmatan pos di beberapa negara mula menggunakan teknologi OCR untuk mempercepatkan pengisihan mel, termasuk Amerika Syarikat, Great Britain, Kanada dan Jerman. OCR masih merupakan teknologi teras yang digunakan untuk mengisih mel untuk perkhidmatan pos di seluruh dunia. Pada tahun 2000, pengetahuan utama tentang had dan keupayaan teknologi OCR telah digunakan untuk membangunkan program CAPTCHA yang digunakan untuk menghentikan bot dan spammer.

Selama beberapa dekad, OCR telah berkembang dengan lebih tepat dan lebih canggih disebabkan oleh kemajuan dalam bidang teknologi yang berkaitan seperti kecerdasan buatan, pembelajaran mesin dan penglihatan komputer. Hari ini, perisian OCR menggunakan pengecaman corak, pengesanan ciri dan perlombongan teks untuk mengubah dokumen dengan lebih pantas dan lebih tepat berbanding sebelum ini.

Soalan Lazim

    Bagaimanakah cara saya mengimbas dokumen dengan telefon atau tablet saya?

    Pada iOS, buka apl Nota dan buat nota baharu. Buka kamera, kemudian ketik Imbas Dokumen. Pada Android, buka Google Drive dan pilih Plus (+), kemudian ketik Scan untuk mengimbas dokumen dengan telefon anda.

    Bagaimana cara saya menggunakan OCR dalam Adobe Acrobat?

    Buka fail PDF yang mengandungi imej yang diimbas, kemudian pilih Tools > Edit PDF. Acrobat akan menggunakan OCR secara automatik supaya anda boleh mengedit teks. Hanya pilih tempat anda ingin membuat pengeditan dan mula menaip.

    Apakah perbezaan antara OCR dan OMR?

    Optical Mark Recognition (OMR) ialah perisian yang mengesan tanda pada kertas, biasanya helaian gelembung. OMR digunakan untuk memproses keputusan peperiksaan, tinjauan, soal selidik, dan juga pilihan raya. Tidak seperti OCR, OMR tidak boleh mentafsir markah pada halaman, tetapi hanya mengesahkan bahawa tanda itu ada.

Disyorkan: