Help - Search - Member List - Calendar
Full Version: Синхронизация звуковых дорожек
Форумы RDA > Технический раздел > Общие вопросы
Pages: 1, 2, 3
altar
Да ну, рекомпрессия... Отличия минимальные. Я не об этом, а о "большой картине".
Беру чистую генерированную гармонику в каждом канале 5.1, собираю вегасом. Потом разбираю BeSweet'ом. Сравниваю фазу и уровень в каждом канале с исходником. Не пробовал?
kvappa
2 userinfoaltar:
Для этого необходимы некоторые специфические знания, чтобы иметь представление - куда и на что смотреть вообще!
Пока что, я могу сравнивать лишь только на слух... frownold.gif
kvappa
М-да... Внимательно послушал конечный результат - всё равно не то! Бисвит искажает одно, здесь же - искажается другое... Придется придумывать что-то другое.
altar
2 userinfokvappa:
Ну а с WaveLab, неужели ничего хорошего так и не вышло? Тогда разве что Серрато где поискать, с таким-то слухом...
kvappa
2 userinfoaltar:
Просто с Wavelab еще не до конца разобрался пока... Как там с многоканальным звуком быть.
Elduderino
Я в Wavelab делал только ресэмплинг (т.е. Time Stretch) на каждом отдельном канале (но с одинаковыми параметрами).

Кстати, проблема с Vegas разрешилась. У меня какой-то странный битый попался дистрибутив, в котором нельзя было делать опции AC3 Encoding. Скачал нормальный, потом зарегил кряком и зарегил отдельно модуль AC3 Encoding - и окно опций чудесны образом открылось. smileold.gif
altar
2 userinfoElduderino:
Так ты же писал, что у тебя проблема была с центральным каналом, замешанным во фронтальные, а не с опциями? Если опций не было - значит была мифическая "корпоративная" версия, типа того, что раздают на торрентс.ру. На руборде - нормальная таблетка, а Вегас и Forge можно скачать напрямую у Сони.

Насчет центрального канала - у меня такое подозрение, что ты точку по углам и в центр квадратов ставишь, но потом не щелкаешь на точки, изображающие остальные динамики - чтобы их отключить. В каждом квадратике, все динамики (кроме того, куда ты точку наводишь) должны быть серыми, отключенными.
Elduderino
QUOTE(altar @ Понедельник, 07 Января 2008, 7:27)
2 userinfoElduderino:
Так ты же писал, что у тебя проблема была с центральным каналом, замешанным во фронтальные, а не с опциями?

Проблема с опциями тоже была, я раньше о ней писал.

QUOTE
Насчет центрального канала - у меня такое подозрение, что ты точку по углам и в центр квадратов ставишь, но потом не щелкаешь на точки, изображающие остальные динамики - чтобы их отключить.
*

Спасибо, в этом и было дело. Прочитал в мануале, в скачанной вчера версии. winkold.gif
kvappa
Убил почти весь понедельник на эксперименты - и теперь могу точно заявить, что касаемо изменения FPS звука - Wavelab рулит!
Altar, спасибо!

Моя ошибка была в том, что я трогал Quantize и Rhythm Accuracy - а это оказался самый верный способ убить звук (разница в качестве вышла отнюдь не небольшая)! Думал, что при растяжке это хоть как-то поможет от гуляния синхронизации между каналами, ибо заявлялось, что результат может отличаться от установленных параметров на несколько мсек.
На практике же оказалось, что волноваться было не очем. Кто бы мог подумать, что можно перекодировать по-одному какое угодно количество каналов, хоть с сохранением высоты, хоть без - и всё выходит как надо, причем качество на выходе - просто класс! Хоть и получается разница +/- до 3 мсек между каналами (при разнице в длине файлов в 0-1 байт), но никаких проблем в дальнейшем это не создает. По результату - полное ощущение, что каналы были обработаны вместе!
Чудесато, так чудесато! Мысль трансформить каналы по-одному казалась бредовой, когда начинал эксперимент, а в итоге всё получилось!

Настройки именно такие, как указывал Altar:

Но, при установке количества Samples в окне Result, эта зараза довольно сильно "округляет" значение (по совершенно не понятной мне логике), что может привести к уходу синхронизации до 200мсек. Впрочем, любые другие значения округляются точно так же. Увидеть это можно, лишь запустив процесс, либо нажав Close и войдя в Time Stretching снова. У меня всё время происходило округление в большую сторону, и приходилось подбирать циферки, пока не получалось ближайшее меньшее значение - тогда рассинхрон выходил уже ничтожно малый.
Хоть и имеется такая странная проблемка, но зато единожды выставленные значения сохраняются. Далее, достаточно подгружать файлы других каналов, вызывая Time Stratching и сразу запуская процесс - что очень удобно. И достаточно быстро, вдобавок.

Nuendo 3, в этом плане, мне не особо понравился - хоть и есть выбор качества работы MPEX, но на максимальном (4), он обрабатывает каждый канал где-то по 1:45:00 (убиться можно!), а результат не лучше точно выходит. Еще и высоту звука не сохранить никак.
altar
Ага, отлично.

Насчет Quantize - так она была активирована или нет? Если тянуть по одному каналу, я бы ее активировал. И выборки у меня вроде не округлялись (если не менять потом другие установки).

А целиком 5.1 в аудио монтаже не пробовал пока тянуть?
kvappa
2 userinfoaltar:
Целиком 5.1 не пробовал, так как не разобрался - как это сделать.
А quantize с Rhythm Accuracy = 0 - не тестил пока. Но думаю, что звук будет рваться всё равно. И тоже был уверен, что quantize нужен - а вышло, что сие не так.

И уверен ли ты, что выборки не округлялись? Точно не уверен, но вроде иногда это может стать заметно даже только после окончания процесса.
Elduderino
Я прусь.

Два раза просчитывал синхронизацию в WaveLab по разным точкам, чтобы сделать Time Stretch. Оба раза - результат выходит один и тот же.

И тем не менее звук постоянно рассинхронизируется "по ходу". То бишь - то и дело убегает.
kvappa
2 userinfoElduderino:
Я и говорю, что он округляет до каких-то значений ближайших, только ему ведомых.
Так что точное значение не получится всё равно, можно лишь посмотреть - до какого значения идет округление, и найти следующее округленное значение, более близкое к тому что требуется.
А просчитывал синхронизацию в разных точках - это в смысле и зачем? Time Stretch делается только один раз, для 25 <-> 23.976 FPS, и для этого нужно посчитать на калькуляторе новое количество фреймов... по ним дальше и ориентироваться. Ну и на продолжительность тоже поглядывая.
Mantisby
QUOTE(Elduderino @ Понедельник, 03 Декабря 2007, 10:57)
У меня почему-то начал глючить Soft Encode, вырубается через несколько секунд после начала кодирования.
*


Аналогичная ситуация. Вырубается в течение 10 секунд после старта. Почему - не могу понять frownold.gif

Пришлось разобраться с Вегасом.
kvappa
2 userinfoMantisby:
Возможно, кривой дистрибутив. Если версия ломаная - глюкам удивляться нечего.
starsoft
2 userinfoMantisby:
Первое что стОит проверить - достаточно ли места на том диске, куда установлен путь для временных файлов.
Mantisby
подскажите, в чем удобнее редактировать 5.1 дорожки. Sound Forge промахивается при растяжении, а WaveLab такие файлы не потянет.

sad.gif
shurikkein
2 userinfoMantisby:
QUOTE
WaveLab такие файлы не потянет.
Неужели один канал превышает 2 гб ? Я тяну именно в wavelab
kvappa
2 userinfoMantisby:
Ни разу не встречал дорожки, которую не потянул бы WaveLab по одному(!) каналу.
Если было бы стерео - тогда еще могло бы быть. Но и тогда можно его по двум моно-каналам разобрать.

Качества лучше всё равно не будет нигде.
Mantisby
QUOTE(kvappa @ Пятница, 16 Января 2009, 2:50)
2 userinfoMantisby:
Ни разу не встречал дорожки, которую не потянул бы WaveLab по одному(!) каналу.
Если было бы стерео - тогда еще могло бы быть. Но и тогда можно его по двум моно-каналам разобрать.

Качества лучше всё равно не будет нигде.
*


про качество согласен. а как все 6 моно каналов в нем одновременно редактировать?
IDDQD
2 userinfoMantisby: О каком редактирование речь идет? Если резка-склейка, то Audition удобнее. Объединяются дорожки в группу в режиме Multitrack. Все последующие действия над дорожкой распространяются на всю группу.
Mantisby
QUOTE(IDDQD @ Пятница, 16 Января 2009, 7:57)
2 userinfoMantisby: О каком редактирование речь идет? Если резка-склейка, то Audition удобнее. Объединяются дорожки в группу в режиме Multitrack. Все последующие действия над дорожкой распространяются на всю группу.
*


У меня дубляж 5.1, причем очень неприятный - длина дубляжа PAL равна длине оригинала в NTSC. Мне нужно сделать из него нормальный PAL.
При этом просто сжать с соответствующим коэффициентом не получилось - в разных местах звук прыгает вплоть до 500 мс.
Я наметил около 20 точек, каждые 10, а иногда и 5 минут. Пока что думаю сжимать каждый кусок отдельно с контролем по оригиналу. Резать-клеить на дубляже скорее всего не получится.

Audition позволяет точно (до десятков мс) сжимать отрезки?

Я пробовал делать 5.1 wav и грузить его в Sound Forge, но на первом же куске у него промахи при сжатии (выставляю в процентах к исходному) до 400ms. frownold.gif
IDDQD
QUOTE(Mantisby @ там)
длина дубляжа PAL равна длине оригинала в NTSC

Наводит на мысль, что версии фильмов разные. Скорее всего в NTSC есть сцены, которые на диске, куда был прикруче дубляж, отсутствуют. Нужно проверять по пикам. Сжимать отдельные куски в Audition нереально. Это придется делать с каждым каналом отдельно.
Mantisby
QUOTE(IDDQD @ Пятница, 16 Января 2009, 12:29)
QUOTE(Mantisby @ там)
длина дубляжа PAL равна длине оригинала в NTSC

Наводит на мысль, что версии фильмов разные. Скорее всего в NTSC есть сцены, которые на диске, куда был прикруче дубляж, отсутствуют. Нужно проверять по пикам. Сжимать отдельные куски в Audition нереально. Это придется делать с каждым каналом отдельно.
*


Нигде упоминания о том, что есть какая-то более полная версия фильма, не видел. На dvdbeaver обзор PAL и NTSC издания - ни слова об этом frownold.gif
К тому же данный дубляж наложен на все BD-HDTV рипы, соответственно вряд ли что-то там пропущено smileold.gif

На торрентсе народ предлагал сравнивать видео, но это муторно, а учитывая дубляж и достаточно малый рассинхрон, мне кажется нереальным frownold.gif

Пробовал делать так - загружал в Wavelab по 2 канала одновременно (фронты вместе, задние вместе, и центр+LFE)- там можно dual mono загрузить, и делал одно и тоже сжатие 3 раза. Но в некоторых местах появилось эхо frownold.gif
shurikkein
2 userinfoMantisby:видео сравнивать не очень муторно, если использовать syncplay. Иногда удобно искать пропущенные кадры, потом нарезать дорожку.
Mantisby
QUOTE(shurikkein @ Пятница, 16 Января 2009, 14:03)
2 userinfoMantisby:видео сравнивать не очень муторно, если использовать syncplay. Иногда удобно искать пропущенные кадры, потом нарезать дорожку.
*

спасибо за подсказку. хотя оригинального видео к дубляжу у меня нет, торрент здесь умер.
Подумал и удалил

но вопрос, как оптимально подгонять 5.1 звук, остается открытым.

Пока что варианты:
1. В Audition засунуть в Multitrack View 6 моно каналов.
2. Сделать 5.1 Wave и открыть его в Sound Forge.

и в том, и в другом случае делать Time Stretch несколько раз неудобно.
kvappa
2 userinfoMantisby:
Один раз меняется FPS на всю дорожку, по одному каналу в Вейвлабе, по очереди. Затем, полученный результат уже рихтуется в Аудишене мультитреком.
Mantisby
QUOTE(kvappa @ Пятница, 16 Января 2009, 19:22)
2 userinfoMantisby:
Один раз меняется FPS на всю дорожку, по одному каналу в Вейвлабе, по очереди. Затем, полученный результат уже рихтуется в Аудишене мультитреком.
*


понятно, буду пробовать, спасибо!
XChesser
Time Stretching можно выполнять в RubberBand - это высококачественная свободная библиотека, предназначенная как раз для этой операции. Вместе с библиотекой распространяется и консольное приложение. В репозитории OpenSUSE также нашёлся LADSPA-плагин, позволяющий выполнять растяжение прямо в аудиоредакторе (Audacity, например). В отличие от SoundForge и WaveLab делает своё дело с точностью до сэмпла. На многоядерном процессоре распараллеливает задачу по ядрам (если не ошибаюсь, другие этого пока не умеют). Проглатывает большие файлы, так что дробить дорожку на каналы нет необходимости.
Доступно несколько настроек:
Опции
Rubber Band
An audio time-stretching and pitch-shifting library and utility program.
Copyright 2008 Chris Cannam. Distributed under the GNU General Public License.

Usage: rubberband [options] <infile.wav> <outfile.wav>

You must specify at least one of the following time and pitch ratio options.

-t<X>, --time <X> Stretch to X times original duration, or
-T<X>, --tempo <X> Change tempo by multiple X (same as --time 1/X), or
-T<X>, --tempo <X>:<Y> Change tempo from X to Y (same as --time X/Y), or
-D<X>, --duration <X> Stretch or squash to make output file X seconds long

-p<X>, --pitch <X> Raise pitch by X semitones, or
-f<X>, --frequency <X> Change frequency by multiple X

The following options provide a simple way to adjust the sound. See below
for more details.

-c<N>, --crisp <N> Crispness (N = 0,1,2,3,4,5); default 4 (see below)
-F, --formant Enable formant preservation when pitch shifting

The remaining options fine-tune the processing mode and stretch algorithm.
These are mostly included for test purposes; the default settings and standard
crispness parameter are intended to provide the best sounding set of options
for most situations. The default is to use none of these options.

-P, --precise Aim for minimal time distortion (implied by -R)
-R, --realtime Select realtime mode (implies -P --no-threads)
--no-threads No extra threads regardless of CPU and channel count
--threads Assume multi-CPU even if only one CPU is identified
--no-transients Disable phase resynchronisation at transients
--bl-transients Band-limit phase resync to extreme frequencies
--no-lamination Disable phase lamination
--window-long Use longer processing window (actual size may vary)
--window-short Use shorter processing window
--pitch-hq In RT mode, use a slower, higher quality pitch shift

-d<N>, --debug <N> Select debug level (N = 0,1,2,3); default 0, full 3
(N.B. debug level 3 includes audible ticks in output)
-q, --quiet Suppress progress output

-V, --version Show version number and exit
-h, --help Show this help

"Crispness" levels:
-c 0 equivalent to --no-transients --no-lamination --window-long
-c 1 equivalent to --no-transients --no-lamination
-c 2 equivalent to --no-transients
-c 3 equivalent to --bl-transients
-c 4 default processing options
-c 5 equivalent to --no-lamination --window-short (may be good for drums)

Доступен для Linux, Mac OS X, Windows.
Главный вопрос - вопрос качества - каждый может сам для себя решить, сравнив с тем же эталонным WaveLab. На мой слух библиотека работает очень качественно, не хуже WaveLab точно.

Если интересно, могу описать процесс синхронизации звуковой дорожки в Linux в свободном редакторе Audacity. Для Windows и Mac OS, впрочем, тоже актуально.

P.S. Если вас устраивает знакомый вам аудиоредактор, и свободная лицензия - недостаточная мотивация для перехода на Audacity, не пишите "за". Не хочется писать статью просто "чтобы было".
shurikkein
2 userinfoXChesser:
Я с линукса сбежал. Пока во всяком случае. Из-за отсутствия нормального софта для блуреев.
Не уверен, что у нас много народа работает с Audacity. По-моему плагин LADSPA, основан на той же библиотеке,что и в besweet.
В audacity , помнится, один из режимов растяжения (кажется, без сохранения высоты) имеет совершенно невменяемую форму расчета. Что-то вроде скорости вращения пластинки
RubberBand не помню такого, это отдельная прога?
kvappa
2 userinfoXChesser:
А на каком из алгоритмов работает RubberBand?
Пока что, по качеству Time Stretch - WaveLab абсолютно вне конкуренции!
XChesser
2 userinfoshurikkein:
LADSPA - плагин RubberBand имел в виду, а не стандартный. Стандартный там обычный WSOLA.
RubberBand - библиотека, консольное приложение и LADSPA-плагин (от OpenSUSE).
Кстати, расчёт по скорости пластинки, по-моему, как раз удобная вещь. Ведь при синхронизации коэффициент растяжения вычисляется именно как отношение, например, 25/23.976. Так что это скорее плюс, чем минус. Но речь всё же шла о RubberBand.
QUOTE
Пока что, по качеству Time Stretch - WaveLab абсолютно вне конкуренции!

Учитывая, что RubberBand не участвовал в сравнении, я бы не стал так говорить winkold.gif А по сравнению с WSOLA, конечно, WaveLab лучше biggrinold.gif
Алгоритм свой собственный у них. Подробнее тут.
Сравните его напрямую с WaveLab. Мои уши говорят мне, что результат по крайней мере не хуже.
shurikkein
2 userinfoXChesser:
QUOTE
расчёт по скорости пластинки, по-моему, как раз удобная вещь
значит, я недопонял, как им пользоваться....
RubberBand понюхаем, послухаем smileold.gif
Kuningas
Ну что, господа, кто пробовал Rubberband?
shurikkein
а этот "резиновый бэнд" существует в удобоваримом виде для винды? Работа в консоли под виндой не прельщает...
XChesser
Нет, только в консоли. Там всё просто: для PAL=>NTSC, например, команда такая будет:
CODE
rubberband -T 25025:24000 input.wav output.wav
shurikkein
2 userinfoXChesser:
понимаю, что просто, но достаточно муторно smileold.gif
главное, что был под винды бесплатный плугин на основе rubberband, но сгинул. sad.gif
http://www.kvraudio.com/get/3343.html
XChesser
2 userinfoshurikkein:
Судя по скриншоту выставить точное значение там вообще нереально.
Если надо GUI, можно на любом языке написать примитивную оболочку - параметров очень мало там.
shurikkein
2 userinfoXChesser:
подскажите, плиз. Сохранение высоты тона и без сохранения. Какие параметры надо ставить для -р ?
так понимаю, что -Т 25000 24000 изменит темп без сохранения высоты тона, а если надо с сохранением?
shurikkein
2 userinfokvappa:
разложил звук с помощью AC3tools, на выходе получил wav с перегрузкой, хрипят каналы в некоторых местах. Если раскладываю с помощью плугина к адобу перегрузки нет.
XChesser
2 userinfoshurikkein:
Честно говоря, с питчем пока не разбирался за ненадобностью.
Из оффициального дока понял, что для этого используется одна из 2 опций по выбору:
-p<X>, поднимает тон на X полутонов.
-f<X>, изменяет частоту в X раз.
shurikkein
2 userinfoXChesser:
QUOTE
за ненадобностью

Я всегда сравниваю с оригинальной дорожкой с блурея на предмет высоты тона.
Наши дорожки с R5 через раз сделаны.
QUOTE
-p<X>, поднимает тон на X полутонов.
-f<X>, изменяет частоту в X раз.

это я тоже прочитал, вопрос , какие значения ставить.
Видимо, придется подбирать в адобе.
XChesser
QUOTE
Наши дорожки с R5 через раз сделаны.

Это как? В смысле половина из них с сохранением тона?
QUOTE
это я тоже прочитал, вопрос , какие значения ставить.

Я полагаю, нужно ставить
CODE
-f.959040959

Но лучше всё-таки проверить smileold.gif
shurikkein
2 userinfoXChesser:
QUOTE
В смысле половина из них с сохранением тона?

Да.
starsoft
Так че - хорошая утилита? СтОит сварганить для нее GUI?
XChesser
По мне, так программа хороша. Но я буду пользоваться консольной версией smile.gif
Для многих GUI, наверное, был бы востребован - подождём мнения других.
Если возьмётесь его писать, думаю, лучше не агрегировать всё в исполняемый файл, а оставить консольный экзешник как есть, написав обёртку. Это чтобы можно было безболезненно обновлять rubberband, не трогая GUI.
starsoft
Смастерил GUI, который запускает консольный ехе-шник с нужными параметрами.
Взять тут или тут. Кому не лень - опробуйте, скажите что не правильно.
kvappa
2 userinfostarsoft:
Супер! Надо будет опробовать, спасибо! А то одна только мысль о командной строке - уже как-то напрягала. smileold.gif
Правда, смогу потестить уже только в январе теперь.
XChesser
Запустил, посмотрел. Приятный интерфейс smile.gif
Несколько замечаний:
Adjastement => Adjustment
Во многие поля не удаётся ввести дробные значения.
При выборе "Raise pitch by 0 semitones" в консоли пишется '--pitch' без значения. Не знаю, работает ли это как '--pitch 0'. Запускал в Linux через Wine - только интерфейс смог оценить. В консольной версии под Linux такое не прокатывает.
Не получается свернуть приложение (хотя, возможно, это Wine виноват).

Если уж совсем придираться, то ещё вот:
В разных местах регистр первых букв слова разный.

Корректность передачи аргументов для этой программы проверить трудно, так что будем надеяться, что команда, отображаемая в окне, как есть и запускается.

Ещё есть предложение добавить профили. Скажем, 4:
NTSC=>PAL без сохранения тона
PAL=>NTSC без сохранения тона
NTSC=>PAL с сохранением тона
PAL=>NTSC с сохранением тона

Спасибо за труды! thumbup.gif
shurikkein
2 userinfostarsoft:
спасибо за труд
QUOTE
В разных местах регистр первых букв слова разный
не вижу такого, нормально всё выглядит (win7-64)
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Invision Power Board © 2001-2025 Invision Power Services, Inc.