Версия для печати темы

Нажмите сюда для просмотра этой темы в оригинальном формате

Форумы RDA _ Общие вопросы _ Переводим субтитры в текстовый формат

Автор: ddolgopolov Вторник, 24 Марта 2009, 22:35

1) Определяем номер сета с интересующим нас фильмом (если это не допы, а основной фильм, то нужный нам сет - тот, в котором самые длинные VOBы, в данном случае - 05):


2) Запускаем SubRip и жмём кнопку с надписью VOB:


3) В поле Action выбираем "SubPictures to Text via OCR" и жмём "Open IFO":


4) Выбираем нужный нам IFO (номер мы запомнили в п. 1):


5) Выбираем нужный нам поток субтитров (ну, здесь только один...):


6) Начинается самое интересное. SubRip не умеет угадывать буквы (как FineReader, например), поэтому его надо научить азбуке. Поскольку субтитры в DVD хранятся в графическом формате (как картинки), а размер, шрифт, настройки обводки и т.д. отличаются, "алфавит" у каждого диска свой. Вводим выделенную букву и нажимаем "ОК" или Enter. Когда эта буква попадётся в следующий раз, программа определит её сама:


7) Когда всё будет распознано, откроется окно субтитров. Делаем автокоррекцию ошибок (особенно полезно для сабов на латиннице, постоянно путается строчная "L" и заглавная "I") - кнопка, обведённая красным. Сохраняем в формате SRT - кнопка, обведённая синим:


Осталась пара пустяков: перевести и отредактировать субтитры, собрать DVD rolleyes.gif

Автор: harbin Вторник, 24 Марта 2009, 22:39

Спасибо огромное, дружище! Завтра и займусь! smile.gif

Автор: kvappa Среда, 25 Марта 2009, 2:28

В русском, как правило проблемы с "ы", ибо как две буквы распознается. Обозначаю как "ьь", и делаю автозамену данного сочетания на "ы" потом. И кавычки вместо " как '' (два апострофа) распознаются. Точно так же, делаю потом автозамену.

Автор: harbin Среда, 25 Марта 2009, 13:15

Создал файл субтитров NewFile.srt, открылся в редакторе скриптов, непонятно откуда взявшемся. Отредактировал 500 субтитров, однако, странное дело, Subtitle Workshop не акцептирует файл, пишет, что "неправильные субтитры или неподдерживаемый формат", txt2sup.exe - тоже определяет файл как чужеродный. Файлы в таком же формате из папки другого фильма акцептируются обеими программами на ура (они имеют ту же пометку SRT. SCRIPT, как и созданный мною файл). Как быть? unsure.gif Как превратить его в sup. или хотя бы проверить насколько правильно создан srt?

Там есть еще функции конвертировать в SRT или - ассоциировать с DSRT... Может быть, это поможет сделать файл правильным и полноценным? В чем может быть заковыка? Спасибо.

Файл NewFile.rar - 16, 1 кб. залил сюда: http://ifolder.ru/11241948
Для желающих помочь - пароль в пм. pomidor.gif

Автор: shurikkein Среда, 25 Марта 2009, 16:58

2 userinfoharbin: Пересохрани не в юникоде.
Когда сохраняешь файл в subrip, прога спрашивает, сохранять в юникоде или нет, надо отвечать нет. И сохранять в ascii.
Или потом в блокноте пересохранить в ascii
Иначе workshop будет талдычить про неправильный формат

Автор: harbin Среда, 25 Марта 2009, 17:17

2 userinfoshurikkein: Спасибо: получилось. smileold.gif smile.gif NewFile.ass
Subtitle Workshop - читает. ascii - не нашел. Сейчас попробую sup.

txt2sup.exe - ass не акцептирует.

Может, теперь из Subtitle Workshop - в какой-то другой формат, который можно сразу привязать к диску, минуя sup.?

Автор: ddolgopolov Среда, 25 Марта 2009, 18:43

QUOTE(harbin @ там)
сразу привязать к диску, минуя sup.

так не бывает biggrin.gif теперь надо обратно в графический формат переводить. мне нравится для этого использовать DVDLab, хотя это несколько "через Ж"

Добавлено:
да, проблема, похоже, именно в том, что файл в кодировке UNICODE. открой .srt Word'ом и сохрани в формате .txt, появится диалог выбора кодировки - выбирай Windows Default. если Workshop полученный файл не откроет, просто смени расширение на .srt и всё

Автор: harbin Среда, 25 Марта 2009, 18:46

2 userinfoddolgopolov: Так ass все же можно перевести в графику? или надо непременно ascii? Я не нахожу этот формат вообще.

Автор: ddolgopolov Среда, 25 Марта 2009, 18:53

нет, не Windows Default, а Cyrillic (Windows). у тебя, похоже, юникод по дефолту и стоит

Добавлено:
ascii - это не формат файла, а 8-битная кодировка набора символов. поскольку 8 бит не позволяют задать все возможные национальные символы, придумали 16-битную кодировку Unicode, которую многие программы не понимают. .srt - это простой текстовый формат, точь-в-точь как .txt, но при сохранении в юникоде в нём каждому символу соответствует не один, а два байта данных, от чего у Workshop'а едет крыша

Автор: harbin Среда, 25 Марта 2009, 18:55

.txt -файл Workshop не открывает, а как сменить на .srt Простое переименование - не идет. Может скачаешь файл, глянешь, что там не так. Пароль - harbin

Автор: ddolgopolov Среда, 25 Марта 2009, 18:58

простое переименование должно помочь.
http://ifolder.ru/11245713

Автор: harbin Среда, 25 Марта 2009, 19:00

Ворд читает только в уникоде, если перевожу в кириллицу Cyrillic (Windows) - выдает какие-то ужасные квадраты.

Автор: ddolgopolov Среда, 25 Марта 2009, 19:03

открывай в юникоде, в кириллицу - при сохранении в формате .txt

Автор: harbin Среда, 25 Марта 2009, 19:05

Скачал и отрыл в Subtitle Workshop , кажется, сейчас должно работать. А как ты так быстро все исправил? smile.gif

Спасибо. Все работает и txt2sup.exe тоже.

Автор: ddolgopolov Среда, 25 Марта 2009, 19:07

я заранее начал ph34r.gif

Добавлено:
пароль ненадёжен laugh.gif

Автор: harbin Среда, 25 Марта 2009, 19:11

2 userinfoddolgopolov: Надо было про славянский шкаф? biggrin.gif Еще раз спасибо! biggrin.gif

Автор: shurikkein Среда, 25 Марта 2009, 20:24

Что-то с пересохранением намудрили вы blink.gif
Открываем в блокноте файл.srt выбираем сохранить как, и выставляем как на картинке, ANSI , все файлы, сохраняется сразу с расширением srt и не в юникоде

Автор: ddolgopolov Среда, 25 Марта 2009, 20:26

2 userinfoshurikkein: я попробовал сразу так, но мне блокнот херню почему-то открыл. в ворде можно кодировку при открытии задавать

Автор: cuervoblanco Суббота, 28 Марта 2009, 8:18

Товарищи спецы!
Пробую первый раз,возникли вопросы. В самом начале при открытие ifo у меня
два варианта english wide & english letterbox какой из этих вариантов лучше выбрать? При распознавании,иной раз выдаются две буквы слитно наподобие: rt или rf,надо так 2 буквы и вводить? unsure.gif

Автор: shurikkein Суббота, 28 Марта 2009, 9:41

2 userinfocuervoblanco:

QUOTE
rt или rf,надо так 2 буквы и вводить?

да, 2 буквы.
Бывает и 3 и 4, и полный текст картинки, если программа не сможет различить отдельные буквы.

QUOTE
какой из этих вариантов лучше выбрать?
имхо, по-барабану.
Это для двд важно, как картинка с субтитрами располагаться будет.


Автор: cuervoblanco Воскресенье, 29 Марта 2009, 0:00

shurikkein, спасибо,все выдрал. smileold.gif

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)