Ada apa

gImageReader – Ekstrak Teks dari Gambar dan PDF di Linux

Anonim

gImageReader adalah pembaca PDF sumber terbuka dan gratis dengan kemampuan untuk mengekstrak teks dari gambar dan PDF. Itu dibangun sebagai front-end Gtk/Qt sederhana untuk Tesseract-OCR, mesin OCR sumber terbuka untuk mengenali teks dan pola dalam dokumen dan gambar menggunakanKecerdasan buatan

Dengan sendirinya, Tesseract adalah alat baris perintah yang dibatasi untuk digunakan oleh pengguna Linux yang cukup akrab dengan terminal mereka. Berkat gImageReader, semua orang sekarang dapat memanfaatkan efisiensi OCR mesin.

gImageReader berfungsi dengan memindai teks dari file PDF atau gambar dalam salah satu dari beberapa bahasa yang didukung berkat keberadaan karakter Unicode . Ini menampilkan antarmuka pengguna yang sederhana dan terorganisir dengan baik yang dapat disesuaikan di mana Anda dapat melakukan tugas-tugas pemeriksaan ejaan dan terjemahan.

Fitur di gImageReader

gImageReader mudah digunakan dan mendukung pekerjaan dengan dokumen salinan lunak serta snapshot dari media yang diunggah, mis. tangkapan layar. Anda bahkan memiliki opsi untuk memilih area teks yang Anda minati dan hanya menambahkan teks yang Anda butuhkan. Pada akhirnya, gImagereader berfungsi sebagai pembaca PDF dan alat ekstraksi teks. Barang konyol.

Instal gImageReader di Linux

Untuk menggunakan gImageReader secara maksimal, Anda harus menginstal secara manual Tesseract paket bahasa sehingga Anda dapat menganalisis gambar dan file dengan benar.Paket ini disebut 'Tesseract-ocr-eng' dan tersedia dari pengelola perangkat lunak di Debiandan Fedora distro.

Jika Anda menjalankan Ubuntu, Anda cukup menambahkan PPAdan jalankan perintah instal menggunakan perintah di bawah ini:

$ Sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo pembaruan apt
$ sudo apt install gimagereader

Aktif Debian, Fedora, dan OpenSUSE instal dari manajer paket.

$ sudo apt install gimagereader
$ sudo dnf instal gimagereader
$ sudo zypper instal gimagereader

Jangan merasa ketinggalan jika Anda menjalankan Arch Linux atau turunannya. AUR membantu Anda. Dan jika Anda lebih suka membangun kembali aplikasi dari sumber, instruksi ada di tautan Wiki repositori GitHub.

Apakah Anda salah satu yang mengekstraksi teks cetak dari gambar? Anda bahkan dapat mengambil snapshot dari area yang dipilih dengan ponsel Anda dan mengunggahnya ke laptop Anda. Yang lebih keren lagi adalah dukungan multibahasanya – yang meskipun tidak sempurna, sudah menjadi salah satu opsi terbaik di komunitas saat ini.

gImageReader adalah salah satu pembaca PDF terbaik di dunia sumber terbuka terutama dengan kemampuan OCR-nya, jadi cobalah dan lihat saja bagaimana Anda menyukainya.

Seperti biasa, Anda dipersilakan untuk berbagi pengalaman Anda dengan aplikasi dengan kami jika ada. Dan untuk menambahkan saran lainnya di bagian komentar di bawah.