Help - Search - Member List - Calendar
Full Version: Синхронизация звуковых дорожек
Форумы RDA > Технический раздел > Общие вопросы
Pages: 1, 2, 3
starsoft
2 userinfoXChesser:
Спасибо за замечания, исправлю.
'--pitch' действительно неверно, ошибка в коде. Может и сработало бы без параметра, но лучше не рисковать.
В каких полях кроме "Stretch" и "Raise pitch" нужны дробные значения? Я сделал только для этих двух исходя из описания утилиты.
Добавил пипку для минимизации.
Регистр букв - вроде бы как должно быть, в заголовках все первые строчные, в названиях параметров - обычные правила строчных и прописных.
Команда, отображаемая в окне - это и есть командная строка, из этого окна она и идет в консоль запуска. Можно скопировать ее и запустить в своем консольном окне.

Скажи какой набор параметров соотвествует каждому из профилей - и сделаю профили.
XChesser
2 userinfostarsoft:
Потыкал консольную версию - дробные значения допустимы абсолютно во всех полях группы "Pitch Ratio Options".
QUOTE
Регистр букв - вроде бы как должно быть, в заголовках все первые строчные, в названиях параметров - обычные правила строчных и прописных.

В таком случае надо бы заменить:
Debug Level => Debug level
Command line => Command Line
Впрочем, это всё такие мелочи! userinfoshurikkein вообще не понял, о чём я, - настолько это несущественно.

А вот для профилей сам пока ещё не знаю параметры для стретчинга с сохранением тона. Это на будущее.
Можно пока сделать первые 2 профиля:
PAL=>NTSC: '--tempo 1001:960'
NTSC=>PAL: '--tempo 960:1001'

При вводе дробных надо потестить, какой разделитель используется. Может оказаться так, что разделитель зависит от локали - тогда и в GUI надо так же сделать. А может получиться наоборот: требуется точка, а в проверке будет использована системная локально-зависимая функция, которая в русской версии запятую будет пропускать, а в английской - точку.
В Linux-версии только точка. Как и всегда smile.gif
starsoft
Обновил програмку. Взять здесь или здесь.

Для преобразования дробных используется дифолтный метод - 6 значащих цифр не считая разделителя. Разделитель - точка. Поскольку код утилиты кроссплатформенный, я думаю что в любой реализации там будет точка. Я выставил в системе запятую, утилита параметры с запятой округлила до целых значений, а с точкой взяла как есть дробными.
shurikkein
Похоже, авторы через другое место сделали biggrinold.gif
Растяжение 25-->23.976 с сохранением тона
-f 1 (т.е. по умолчанию)
Растяжение 25-->23.976 без сохранения
-f 0.95904
время обработки приблизительно одинаковое 480 секунд и 520 секунд соответственно

У Аудишн растяжение этой же дорожки с сохранением высоты составило около 7 минут (похоже по времени на rubberband)
без сохранения - около 2 минут

получается, в отличие от audition, обработка для высоты тона в rubberband включается всегда. Хорошо это или плохо, не знаю.

При выборе пресета в GUi выставляется значение только для длительности, параметры для частоты или полутона не меняются. Выставишь , например, 25 - будет 25.
starsoft
2 userinfoshurikkein:
Погоди, я мало что понимаю в обработке звука кроме общих принципов. Ты хочешь сказать что для пресета "PAL=>NTSC без сохранения тона" надо выставить "--tempo 1001:960 -f 0.95904" а для "PAL=>NTSC с сохранением тона" надо только "--tempo 1001:960"?
shurikkein
2 userinfostarsoft:
получается так, вчера тянул дорожку , слушал, сравнивал результаты .
Не думаю, что слух меня обманул.
(я, правда, не заморачивался с упрощениями и ставил --tempo 25000:23976)
XChesser
QUOTE
Растяжение 25-->23.976 с сохранением тона -f 1 (т.е. по умолчанию)

Будем знать.
QUOTE
я, правда, не заморачивался с упрощениями и ставил --tempo 25000:23976

Правильнее 25025:24000. Погрешность небольшая, 8 мс с двухчасового фильма, но всё же.

2 userinfoshurikkein:
Главный вопрос: как дела с качеством?
shurikkein
QUOTE
Правильнее 25025:24000
да, так точнее должно быть, если округление не съест.
В адобе и лабе, как ни высчитывай, всё ограничено точностью ratio 104.271
здесь пока не понял.
QUOTE
как дела с качеством

не сравнивал пока.
и тогда встречный вопрос, как и с чем сравнивать?
Растянуть, потом обратно "стянуть", в адобе вычесть из оригинальной дорожки и посмотреть на разницу? так?



XChesser
QUOTE
и тогда встречный вопрос, как и с чем сравнивать? Растянуть, потом обратно "стянуть", в адобе вычесть из оригинальной дорожки и посмотреть на разницу? так?

Неа, ИМХО это не критерий качества. По этому критерию лучшим окажется как раз самый тупой алгоритм, по -моему: ASOLA выиграет у того же WaveLab наверно.
Я бы на слух оценивал. А чтобы не мешали предубеждения, "слепое сравнение" можно устроить. В foobar, например.
shurikkein
Посравнивал звучание двух дорожек, растянутых в адобе и в rubberband, приклеил ас3 к фильму. Не заметил никакой разницы.
QUOTE
В адобе и лабе, как ни высчитывай, всё ограничено точностью ratio 104.271

здесь тоже самое, только запятая перенесена, в командной строке высвечивается:
1.04271
загрузить сэмпл не могу - провайдер тестирует повышенные скорости, поэтому скорость околомодемная biggrinold.gif
XChesser
Проверил в Linux - то же самое. Такое же округление.
Посмотрю, что на выходе получается. Может, это вывод в консоль округляется, чтобы не пугать полным double.

А на выходе вот что:
CODE
rubberband --tempo 25025:24000 ...
...
Using time ratio 1.04271 and frequency ratio 1
...
in: 438806016, out: 457546690, ratio: 1.04271, ideal output: 457546690, error: 0

CODE
rubberband --tempo 25000:23976 ...
...
Using time ratio 1.04271 and frequency ratio 1
...
in: 438806016, out: 457547147, ratio: 1.04271, ideal output: 457547147, error: 0

Как видно, разница есть, т.е. округление производится при выводе на консоль, а сам алгоритм работает с более высокой точностью.
starsoft
2 userinfoshurikkein:
2 userinfoXChesser:
Так какой параметр изменения частоты надо поставить для "NTSC=>PAL без сохранения тона"?
shurikkein
NTSC=>PAL без сохранения тона
-f 1.04271
так получается
starsoft
Обновил програмку для ваших параметров профайлов, проверяйте, говорите что исправить.

Взять тут или тут.
shurikkein
2 userinfostarsoft:
Спасибо!
shurikkein
Наткнулся на странную сборку. Качнул двд (с тру, golden child), ntsc, четыре звуковых дорожки.
Разобрал DGIndex-ом, три дорожки "нормальные", а одна короткая, расчитанная на 25 фпс, пришлось растягивать.
Внутри двд воспроизводится нормально, без опережения.
Как так можно собрать ? Просто любопытно стало.
Mantisby
в двд афаик так быть не должно.

какая продолжительность у нормальной и короткой дорожек?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Invision Power Board © 2001-2025 Invision Power Services, Inc.