OurDVD - Forum - IdxSubOcr使用報告

why1812 写:

在简体系统下OCR的结果和繁体系统是一样的。

可以推論辨認最重要的因素就是OCR ENGINE，程式主要是執行週邊的工作…

辨認錯誤，要改進就一定要從根源的OCR ENGINE著手，看來都沒有什麼解救了！

SubToSrt在這方面加進了學習功能，所以將新的字加進字庫便可以改善辨認效果，這是比這個程式優勝的地方。

至於一個字變成多個字的情況，其實應該可以解決；因為中文字是方塊字，基本上都是等寬的，所以OCR ENGINE應該從這個方向去改善(我猜這是因為其他語言沒有這個特性，所以編寫程式的都沒有去考慮這個方向)，就不會將一個字變成幾個了。

在繁體系統下，如果用未經漢化的版本，一定要對程式相當熟悉，因為我們看不到那些說明呢！

bigcondor 写:

今天再用這個程式辨識Cypher這個片，以前這個idx+sub檔用SubToSrt辨認困難而停止了，今天用IdxSubOcr就頗順利，不過有一些地方還是要注意： -

字幕不能讀進Subtitle Workshop…

其實昨天也發現這個問題，只不過未有時間去探究。我喜歡用Subtitle Workshop來校正一些字幕的格式(用慣了！)，但IdxSubOcr產生的字幕就未能被Subtitle Workshop所接受。今天我用SubResync將字幕讀入再儲存，然後比對兩個字幕，就發現問題所在：-
時間的格式最後的千份之一秒應該是用“,”來分隔，而不是用“.”。
此外，1和l很難辨識，要小心核對。

這個又來了次序錯誤的問題，所以還是小心逐行檢查較好；而空行也不單單在單字出現！

BC大，软件默认是帧，可以设置为毫秒。

謝謝why1812兄…

今天做“貓”的時候，又發現了一個問題…

字幕裡有些沒有字幕的空行，我便使用“刪除當前行”的按鈕把那行字幕刪除…

在此以後，當我使用取代功能時，畫面和顯示出來的字幕並不同步…

所以要刪除整行字幕應該在編輯完才進行吧！

页: 1 2