Mengenal OCR (Optical Character Recognition) untuk deteksi teks pada gambar
Apa anda pernah mendengar istilah OCR?
Ya, OCR merupakan kepanjangan dari Optical Character Recognition sebagai teknologi yang dapat membedakan dan mengenali bentuk tulisan pada gambar, mengkonversi berbagai jenis dokumen, seperti konversi gambar huruf menjadi karakter ASCII yang dikenali oleh komputer.
Lalu apa bedanya dengan Scanner?
Ya, keduanya dapat dikatakan mirip, tetapi teknologi OCR memiliki cara kerja dan teknis yang berbeda dari scanner.
Perlunya konversi gambar huruf menjadi karakter ASCII dikarenakan memiliki kapasitas yang lebih kecil.
Selain itu, dengan menggunakan OCR anda dapat langsung melakukan perubahan teks dokumen yang telah discan dengan alat yang memiliki sistem atau program OCR. Berbeda dengan scanner, dimana ketika anda melakukan pengeditan pada teks yang telah di scan kedalam program pengolahan data, pasti anda tidak akan bisa melalukan pengeditan teks tersebut. Hal ini dikarenakan cara kerja scanner yang hanya mengubah teks atau dokumen kedalam bentuk gambar seperti JPG.
Berikut Cara Kerja OCR, yaitu:
-
Meratakan Gambar
Kemiringan file image atau gambar akan diatur jika hasil scan ada kemiringan, menjadi sejajar atau lurus.
-
Mengatur Arah Gambar
OCR akan mengambil sebagian area gambar dan mengetahui arah teks yang benar dengan pilihan 90°, 180° atau 270°
-
Menganalisa
OCR akan menganalisa dan memisahkan bagian teks dan bagian gambar.
-
Mengidentifikasi Gambar
mengidentifikasi satu persatu gambar yang sudah dipisahkan dan melakukan pengecekan terhadap database yang dimiliki oleh software serta menetapkan huruf dan angka.
-
Memisahkan Karakter dan Huruf
OCR akan memisahkan tiap karakter yang ada pada gambar menjadi sebuah angka atau huruf.
-
Menghasilkan File Akhir
Jika sudah selesai dalam merubah image, maka OCR akan menghasilkan file dengan format teks seperti Ms Word, Ms Excel, TXT dan Rich Text, sesuai dengan pengaturan anda diawal.
Adapun 5 Free OCR software yang dapat anda gunakan:
-
Photo Scan
Memiliki fungsi OCR yang dapat mengolah teks dari sebuah gambar. Selain itu, aplikasi ini juga dapat melakukan scanning dan generate QR Code
-
Google Docs
Memiliki sistem OCR yang mampu mendeteksi dan mengenali tulisan dalam gambar/dokumen dalam bentuk PDF
Cara penggunaannya sebagai berikut:
- Login ke dalam google drive anda
- Upload data (dokumen PDF/Gambar) yang ingin anda ubah ke dalam google drive anda
- Klik kanan pada file PDF dan pilih “open with google docs”
- Dokumen (PDF atau gambar) akan terbuka dalam google docs dan anda dapat mengeditnya langsung.
-
Microsoft OneNote
Mampu mendeteksi kata, baik dari gambar maupun bentuk scan catatan tulisan tangan. Anda hanya perlu membuka file dokumen atau gambar scan, klik kanan dan pilih pilihan “copy text from picture (printout)” dan selesai.
-
Simple OCR
Aplikasi ini memiliki dua versi, yaitu aplikasi gratis dan berbayar. Versi berbayar dapat mengenali huruf secara akurat meskipun kualitas sumbernya kurang bagus atau dalam dokumen memiliki multi kolom.
-
a9t9 Software
Bersifat open source yang dapat fitemukan pada microsoft store. Aplikasi ini mendukung 20 jenis bahasa yang dalam pemasangannya sangat mudah dan anda dapat melakukan imrovisasi dan penyesuaian program.