OurDVD - Forum

完整版本: IdxSubOcr使用報告
You're currently viewing a stripped down version of our content. View the full version with proper formatting.

why1812 写:
在简体系统下OCR的结果和繁体系统是一样的。


可以推論辨認最重要的因素就是OCR ENGINE,程式主要是執行週邊的工作…

辨認錯誤,要改進就一定要從根源的OCR ENGINE著手,看來都沒有什麼解救了!

SubToSrt在這方面加進了學習功能,所以將新的字加進字庫便可以改善辨認效果,這是比這個程式優勝的地方。

至於一個字變成多個字的情況,其實應該可以解決;因為中文字是方塊字,基本上都是等寬的,所以OCR ENGINE應該從這個方向去改善(我猜這是因為其他語言沒有這個特性,所以編寫程式的都沒有去考慮這個方向),就不會將一個字變成幾個了。

在繁體系統下,如果用未經漢化的版本,一定要對程式相當熟悉,因為我們看不到那些說明呢!

bigcondor 写:
今天再用這個程式辨識Cypher這個片,以前這個idx+sub檔用SubToSrt辨認困難而停止了,今天用IdxSubOcr就頗順利,不過有一些地方還是要注意: -

字幕不能讀進Subtitle Workshop…



其實昨天也發現這個問題,只不過未有時間去探究。我喜歡用Subtitle Workshop來校正一些字幕的格式(用慣了!),但IdxSubOcr產生的字幕就未能被Subtitle Workshop所接受。今天我用SubResync將字幕讀入再儲存,然後比對兩個字幕,就發現問題所在:-
時間的格式最後的千份之一秒應該是用“,”來分隔,而不是用“.”。
此外,1和l很難辨識,要小心核對。



這個又來了次序錯誤的問題,所以還是小心逐行檢查較好;而空行也不單單在單字出現!


BC大,软件默认是帧,可以设置为毫秒。

謝謝why1812兄…

今天做“貓”的時候,又發現了一個問題…

字幕裡有些沒有字幕的空行,我便使用“刪除當前行”的按鈕把那行字幕刪除…

在此以後,當我使用取代功能時,畫面和顯示出來的字幕並不同步…



所以要刪除整行字幕應該在編輯完才進行吧!
页: 1 2
Reference URL's