OCR là gì?

Sau khi scan tài liệu, ta có thể lưu file dưới dạng djvu hoặc pdf. Tuy nhiên văn bản sẽ được lưu dưới dạng ảnh, gây khó khăn cho việc tìm kiếm trong văn bản. Sử dụng OCR ta có thể chuyển đổi một văn bản (ảnh) thành một văn bản thực thụ, nơi ta có thể dễ dàng tìm các từ, các khái niệm mà ta muốn như tìm trong một văn bản word thông thường. Thật là tiện lợi và thú vị. Phần mềm Document Express Professional Editor 6.0 của LizardTech (có thể tìm thấy ở http://bmgt.wordpress.com) có một tiện ích giúp ta làm được điều này.

4 phản hồi tới “OCR là gì?”

  1. tinhanh nói:

    ap loi thuan xa my loi b

  2. Phan Lê Anh Nhật nói:

    việc chuyển đổi từ hình sang text là bất cập. nếu văn bản chỉ là tiếng Anh, thì khi chuyển đổi còn chấp nhận được, nhưng khi có các công thức toán học hay tiếng việt thì nó chuyển đổi rất lung tung!

    • doanchi nói:

      Vâng, chính xác là như vậy. Tuy nhiên, OCR giúp ta tra cứu một cách dễ dàng. Đơn giản như bạn đọc một cuốn sách có Mục lục, Index sẽ thú vị hơn rất nhiều so với một cuốn sách không có Mục lục, Index, phải không ạ?


Để lại hồi âm