Help - Search - Member List - Calendar
Full Version: Переводим субтитры в текстовый формат
Форумы RDA > Технический раздел > Общие вопросы
ddolgopolov
1) Определяем номер сета с интересующим нас фильмом (если это не допы, а основной фильм, то нужный нам сет - тот, в котором самые длинные VOBы, в данном случае - 05):


2) Запускаем SubRip и жмём кнопку с надписью VOB:


3) В поле Action выбираем "SubPictures to Text via OCR" и жмём "Open IFO":


4) Выбираем нужный нам IFO (номер мы запомнили в п. 1):


5) Выбираем нужный нам поток субтитров (ну, здесь только один...):


6) Начинается самое интересное. SubRip не умеет угадывать буквы (как FineReader, например), поэтому его надо научить азбуке. Поскольку субтитры в DVD хранятся в графическом формате (как картинки), а размер, шрифт, настройки обводки и т.д. отличаются, "алфавит" у каждого диска свой. Вводим выделенную букву и нажимаем "ОК" или Enter. Когда эта буква попадётся в следующий раз, программа определит её сама:


7) Когда всё будет распознано, откроется окно субтитров. Делаем автокоррекцию ошибок (особенно полезно для сабов на латиннице, постоянно путается строчная "L" и заглавная "I") - кнопка, обведённая красным. Сохраняем в формате SRT - кнопка, обведённая синим:


Осталась пара пустяков: перевести и отредактировать субтитры, собрать DVD rolleyes.gif
harbin
Спасибо огромное, дружище! Завтра и займусь! smile.gif
kvappa
В русском, как правило проблемы с "ы", ибо как две буквы распознается. Обозначаю как "ьь", и делаю автозамену данного сочетания на "ы" потом. И кавычки вместо " как '' (два апострофа) распознаются. Точно так же, делаю потом автозамену.
harbin
Создал файл субтитров NewFile.srt, открылся в редакторе скриптов, непонятно откуда взявшемся. Отредактировал 500 субтитров, однако, странное дело, Subtitle Workshop не акцептирует файл, пишет, что "неправильные субтитры или неподдерживаемый формат", txt2sup.exe - тоже определяет файл как чужеродный. Файлы в таком же формате из папки другого фильма акцептируются обеими программами на ура (они имеют ту же пометку SRT. SCRIPT, как и созданный мною файл). Как быть? unsure.gif Как превратить его в sup. или хотя бы проверить насколько правильно создан srt?

Там есть еще функции конвертировать в SRT или - ассоциировать с DSRT... Может быть, это поможет сделать файл правильным и полноценным? В чем может быть заковыка? Спасибо.

Файл NewFile.rar - 16, 1 кб. залил сюда: http://ifolder.ru/11241948
Для желающих помочь - пароль в пм. pomidor.gif
shurikkein
2 userinfoharbin: Пересохрани не в юникоде.
Когда сохраняешь файл в subrip, прога спрашивает, сохранять в юникоде или нет, надо отвечать нет. И сохранять в ascii.
Или потом в блокноте пересохранить в ascii
Иначе workshop будет талдычить про неправильный формат
harbin
2 userinfoshurikkein: Спасибо: получилось. smileold.gif smile.gif NewFile.ass
Subtitle Workshop - читает. ascii - не нашел. Сейчас попробую sup.

txt2sup.exe - ass не акцептирует.

Может, теперь из Subtitle Workshop - в какой-то другой формат, который можно сразу привязать к диску, минуя sup.?
ddolgopolov
QUOTE(harbin @ там)
сразу привязать к диску, минуя sup.

так не бывает biggrin.gif теперь надо обратно в графический формат переводить. мне нравится для этого использовать DVDLab, хотя это несколько "через Ж"

Добавлено:
да, проблема, похоже, именно в том, что файл в кодировке UNICODE. открой .srt Word'ом и сохрани в формате .txt, появится диалог выбора кодировки - выбирай Windows Default. если Workshop полученный файл не откроет, просто смени расширение на .srt и всё
harbin
2 userinfoddolgopolov: Так ass все же можно перевести в графику? или надо непременно ascii? Я не нахожу этот формат вообще.

ddolgopolov
нет, не Windows Default, а Cyrillic (Windows). у тебя, похоже, юникод по дефолту и стоит

Добавлено:
ascii - это не формат файла, а 8-битная кодировка набора символов. поскольку 8 бит не позволяют задать все возможные национальные символы, придумали 16-битную кодировку Unicode, которую многие программы не понимают. .srt - это простой текстовый формат, точь-в-точь как .txt, но при сохранении в юникоде в нём каждому символу соответствует не один, а два байта данных, от чего у Workshop'а едет крыша
harbin
.txt -файл Workshop не открывает, а как сменить на .srt Простое переименование - не идет. Может скачаешь файл, глянешь, что там не так. Пароль - harbin

ddolgopolov
простое переименование должно помочь.
http://ifolder.ru/11245713
harbin
Ворд читает только в уникоде, если перевожу в кириллицу Cyrillic (Windows) - выдает какие-то ужасные квадраты.
ddolgopolov
открывай в юникоде, в кириллицу - при сохранении в формате .txt
harbin
Скачал и отрыл в Subtitle Workshop , кажется, сейчас должно работать. А как ты так быстро все исправил? smile.gif

Спасибо. Все работает и txt2sup.exe тоже.
ddolgopolov
я заранее начал ph34r.gif

Добавлено:
пароль ненадёжен laugh.gif
harbin
2 userinfoddolgopolov: Надо было про славянский шкаф? biggrin.gif Еще раз спасибо! biggrin.gif
shurikkein
Что-то с пересохранением намудрили вы blink.gif
Открываем в блокноте файл.srt выбираем сохранить как, и выставляем как на картинке, ANSI , все файлы, сохраняется сразу с расширением srt и не в юникоде
ddolgopolov
2 userinfoshurikkein: я попробовал сразу так, но мне блокнот херню почему-то открыл. в ворде можно кодировку при открытии задавать
cuervoblanco
Товарищи спецы!
Пробую первый раз,возникли вопросы. В самом начале при открытие ifo у меня
два варианта english wide & english letterbox какой из этих вариантов лучше выбрать? При распознавании,иной раз выдаются две буквы слитно наподобие: rt или rf,надо так 2 буквы и вводить? unsure.gif
shurikkein
2 userinfocuervoblanco:
QUOTE
rt или rf,надо так 2 буквы и вводить?

да, 2 буквы.
Бывает и 3 и 4, и полный текст картинки, если программа не сможет различить отдельные буквы.

QUOTE
какой из этих вариантов лучше выбрать?
имхо, по-барабану.
Это для двд важно, как картинка с субтитрами располагаться будет.


cuervoblanco
shurikkein, спасибо,все выдрал. smileold.gif
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Invision Power Board © 2001-2024 Invision Power Services, Inc.