Отправляет email-рассылки с помощью сервиса Sendsay

[TC] Gemini делает тифлокомментарии к видео, пробуйте.

Здравствуйте все!!!
Недавно обратил внимание, что Gemini может работать с видео, если
прикрепить к сообщению видеофайл и вот задумался, а не попросить ли
Gemini создать тифлокомментарий к видеоролику.
Но, чтобы не просить каждый раз, объясняя всё подробно, решил создать
Gem-бота с инструкцией, которую процитирую ниже.
Сама по себе Gemini не сможет говорить, выдерживая нужные паузы между
тифлокомментариями, не заточен там синтез речи под такие задачи.
Поэтому, решил я попросить Gemini писать текст тифлокомментариев в
формате субтитров SRT.
Это человекочитаемый формат, в котором указывается номер субтитра,
время появления и время исчезновения каждого субтитра и сам текст
субтитра.
Следующим шагом будет озвучка субтитров с помощью синтезатора речи,
но, всё по порядку.
1. Создаём Gem-бота.
Для этого заходим на
https://gemini.google.com

Если заходим с мобильного устройства, в браузере переключаемся на
отображение версии для ПК, потому как, в мобильной версии разработчики
забыли сделать кнопку "Сохранить".
Зашли на сайт и открываем меню кнопкой в левом верхнем углу страницы.
В открывшемся меню выбираем пункт "Gem-боты".
Откроется страница с заголовком "Менеджер Gem-ботов".
На этой странице находим и нажимаем кнопку "Создать Gem-бота".
Открывается форма и мы вводим информацию.
В редакторе "Название" пишем осмысленное название бота:
"Тифлокомментатор видео".
В редакторе "Описание" пишем: " Этот бот создаёт тифлокомментарии к
предоставленному видео в формате субтитров SRT".

Далее идёт редактор "Инструкция", самый важный.
Скопируйте в него следующий промт.

Начало цитаты.

Ты 'Тифлокомментатор видео'. Твоя задача -- создавать для незрячих пользователей тифлокомментарии к видео в формате субтитров SRT. Ты должен строго следовать инструкциям по форматированию SRT и правилам размещения комментариев в паузах между речью героев.

Цель и Задачи:

* Предоставлять максимально точные и информативные описания визуального ряда (действия, место, эмоции, важные детали) для незрячих пользователей.

* Генерировать комментарии в строгом формате SRT, включая порядковый номер, точную временную метку и текст описания.

* Обеспечить, чтобы текст комментария был кратким и легко произносимым синтезатором речи в рамках заданного временного интервала (приблизительно 150-160 слов в минуту).

Поведение и Правила:

1) Формат SRT:

a) Каждый комментарий должен состоять из трех элементов: порядковый номер, временная метка и сам текст комментария. Элементы разделяются пустыми строками, как показано в примере.

б) Временная метка должна быть в формате ЧЧ:ММ:СС,мс --> ЧЧ:ММ:СС,мс (три цифры для миллисекунд).

в) Ты должен использовать временные интервалы, которые пользователь тебе предоставляет, или, если пользователь предоставляет только сценарий, ты должен логически определить паузы между репликами героев для размещения комментариев.

2) Размещение Комментариев:

a) Приоритет No1: Не перекрывать речь героев или другие важные звуки. Тифлокомментарии должны размещаться только в паузах.

б) Если пауза слишком короткая, чтобы произнести адекватное описание, описание следует сократить или разбить на части и разместить в соседних паузах.

c) Если пользователь предоставляет сценарий, ты должен проанализировать его и разместить тифлокомментарии между репликами.

3) Стиль Комментариев:

a) Комментарии должны быть нейтральными, объективными и описательными (например, 'Крупный план ярко-красного яблока.' вместо 'Какое красивое яблоко!').

б) Использовать лаконичный и точный язык. Избегать лишних слов.

Образец Вывода (строго соблюдать):

1

00:00:00,000 --> 00:00:03,500

Крупный план ярко-красного яблока.

2

00:00:05,000 --> 00:00:06,800

Герой берёт яблоко со стола.

3

00:00:09,500 --> 00:00:12,200

Герой откусывает яблоко.

Общий Тон:

* Будь точным, внимательным к деталям и профессиональным. Твой фокус -- на доступности и функциональности.

Конец цитаты.

После того, как данный промт вставлен, находим и нажимаем кнопку
"Сохранить".

Бот создан, мы всегда можем найти и открыть бота в меню Gemini, в
подразделе Gem-боты.

2. Генерация тифлокомментариев к видео.
Открываем созданного бота через меню Gemini в подразделе "Gem боты"/
Поскольку тексты тифлокомментариев могут быть большими, под редактором
для ввода сообщения находим кнопку "Инструменты" и выбираем режим
"Canvas". Теперь на этот холст будет выводиться готовый контент.
Далее прикрепляем к сообщению видеофайл, в сообщении пишем что-то вроде
"Сделай тифлокомментарии к этому видео", отправляем и ждём.
Когда генерация закончится, на холсте появятся тифлокомментарии,
написанные в формате субтитров SRT.
Над холстом находим кнопку "Поделиться" и в появившемся меню выбираем
пункт "Копировать контент".

Текст из Canvas скопирован и теперь нам надо его сохранить.
Создаём текстовый документ, открываем Блокнотом, вставляем и сохраняем.
Важно! Почему-то при копировании с Canvas в блокнот теряется разбивка
на строки.
Если такое происходит, сперва скопируйте в Word, форматирование
сохранится, а потом из Word в Блокнот и сохраните, тогда
форматирование тоже сохранится.
Переименовываем наш текстовый документ с комментариями.
Расширение "TXT" меняем на "srt".
Имя файла до расширения должно совпадать с именем видеофайла до
расширения.
Например, мы делаем тифлокомментарии к видеофайлу под названием
"Проходим капчу.mp4".
Значит, наш файл с субтитрами должен называться
"Проходим капчу.srt".
Помещаем этот файл в ту же папку, в которой находится видеофайл.
Теперь, когда мы будем запускать этот видеофайл, плееры будут видеть
субтитры и показывать их на фоне видео.
Но, тифлокомментарии в виде субтитров нам не подходят, поэтому
переходим к следующему шагу.

3. Озвучка субтитров.
Можно озвучить субтитры двумя способами.
Первый способ, это установить проигрыватель "PotPlayer", в настройках
этого проигрывателя найти раздел "Диктор" и включить опцию "Озвучивать
текстовые субтитры".
После этого открываем видео в "PotPlayer" и слушаем его с
тифлокомментариями в исполнении SAPI5 синтезатора речи.
Скачать "PotPlayer" можно с официального сайта по ссылке:
https://potplayer.daum.net

Просто, но у этого способа есть большой минус. Когда на экране
появляется субтитр с тифлокомментариями, плеер и SAPI5 синтезатор
собираются с мыслями, озвучка начинается не сразу, если
тифлокомментарии в субтитрах меняются быстро, плеер не учитывает
длительность субтитров и воспроизводит речь всегда с одной и той же,
установленной в настройках скоростью речи. В результате,
тифлокомментарии запаздывают и перекрывают речь людей в видео.

Поэтому, я советую другой способ, а именно, озвучить тифлокомментарии
в программе "Балаболка".
Скачать Балаболку можно с официальной странице по ссылке:
https://www.cross-plus-a.com/ru/balabolka.html

Устанавливаем и запускаем Балаболку.
Выбираем синтезатор речи, которым хотим озвучить субтитры.
Нажимаем комбинацию клавиш CTRL+Shift+H, чтобы открыть диалог
преобразования субтитров в речь.

После этого находим и нажимаем кнопку "Добавить файлы" и в появившемся
окне открытия файла выбираем наш файл субтитров с тифлокомментариями.
Затем нажимаем кнопку "Выбрать" и указываем папку, в которую нужно
сохранить готовый аудиофайл.
В комбинированном списке "Формат аудиофайлов" выбираем "WAV
аудиофайлы".

Затем переходим на вкладку "Настройки" и отмечаем флажок
"Автоматически увеличивать скорость речи для того, чтобы уложиться в
интервалы времени".
Эта ключевая настройка, которая позволит синтезатору речи укладываться
в отведённые в субтитрах интервалы времени. Когда нужно, речь будет
звучать быстрее.
Там же, с помощью ползунка можно установить максимальную скорость
речи, которую синтезатор не будет превышать, даже если фраза всё-ещё
не укладывается в интервал.
Так же советую установить флажок "Восстановить предложения, которые
поделены на части". В субтитрах текст часто разбивают на несколько
строк для более удобного отображения на кране.
Gemini так вроде не делает, но, если всё-таки сделает, фраза будет
прочитана с паузой и понижением интонации, как два предложения или
даже больше, смотря сколько переносов строк.
Поэтому, этот флаг тоже лучше отметить, хуже не будет.
После этого нажимаем кнопку "Преобразовать" и ждём.
В итоге, мы получим файл, в котором есть только звук тифлокомментариев
без звука видео.
Микшируем его со звуком видео в своём любимом звуковом редакторе, а
если хотим сохранить и видеоряд, готовый микс снова подсовываем в
видео, например, с помощью программы "MKVToolNix GUI".
Программа позволяет работать с дорожками видеофайлов-контейнеров и
подменять некоторые из них без необходимости конвертировать всё видео.
На выходе получаются MKV файлы.
Скачать "MKVToolNix GUI" можно с официального сайта по ссылке:
https://mkvtoolnix.org

С помощью Gemini и Балаболки я сделал тифлокомментарии к шуточному
видеоролику под названием "Проходим капчу".
Скачивайте результат с Яндекс-Диска по ссылке:
https://disk.yandex.ru/i/Gpa0N3JMAYwqyg

Скачивайте текст тифлокомментариев в формате SRT по ссылке:
https://disk.yandex.ru/d/unSQIVbG9kTHpA

Я не редактировал текст, тифлокомментарии озвучены и написаны в том
виде, в котором их сделала Gemini.

Озвучку тифлокомментариев сделал синтезатором речи RHVoice Alexandr.

Ещё важные моменты. Gemini не плохо работает с некоторыми MP4 файлами,
она явно понимает и видео, и звук, знает, кто и что сказал.
Но иногда звук для неё недоступен и она знает только видеоряд, в
результате, тифлокомментарии получаются хуже.
Чтобы проверить, доступен ли Gemini звук из конкретного файла,
прикрепите файл к сообщению и спросите что-нибудь о разговорах в
видео, кто что сказал или что-то похожее. Если ответит. то со звуком
всё для неё нормально.

Кстати, с созданием тифлокомментариев неплохо справляется даже
бесплатная модель Gemini 2.5 Flash. У Gemini есть лимиты на размер файла и продолжительность видео, она сделает комментарии только к небольшим видеороликам.

В Google AI Studio я навайбкодил приложение для создания
тифлокомментариев, и оно даже работало и озвучивало тифлокомментарии
красивыми нейросетевыми голосами. Но, я очень быстро упёрся в лимиты
API на бесплатном тарифе, слишком много раз созданное приложение
запрашивало преобразование коротких текстовых фраз в речь. Перешёл на
системные и безлимитные SAPI5 голоса, и оно даже пыталось работать,
но, после очередного закрытия браузера приложение исчезло из моего
профиля в AI Studio. В Google Claude я его не разворачивал.
Кто-нибудь в курсе, что за фокусы и почему приложение просто исчезло?

     ответов: 0   2025-12-08 02:16:44 (#3715351)

[TC] Как уменьшить болтливость NVDA

Всех приветствую друзья. Сталкнулся вот с такой проблемой:
После переустановки windows 10 установил NVDA, и она стала проговаривать
слишком много лишнего при обычных стандартных действиях. К примеру,
вхожу на диск (C) из папки "этот компьютер", и синтезатор мне выдает
следующий текст: "Локальный диск (C), просмотр элементов, этот
компьютер, не выделено, развернуто, два из три, уровня один, локальный
диск (C) свернуто, четыре из шесть, уровня 2".
И вот примерно такую терраду приходится выслушивать каждый раз при
открытии любого диска или папки. И не понятно зачем он говорит "про
уровни, закрыто, открыто" ведь я не по дереву хожу. Помогите
разобраться. может какие-то настройки подкрутить надо. Сам не догоняю,
голову сломал.
С уважением Андрей.

     ответов: 20   2025-12-07 19:23:49 (#3715196)

[TC] Как теперь сделать закладку в хроме

Всем добрый вечер! С некоторых пор не могу сделать закладку в хроме.
раньше заходил на страницу, жал ф6 и по табу очень шустро находил пункт
сделать закладку, теперь же, заходя на страницу и нажав ф6, где говорит
адресную строку, затем жму таб и там такой пункт: Кнопка режима ИИ.
Нажмите Ввод, чтобы активировать режим ИИ, нажимаю на него, так выходит
страница google. Есть ли другой способ сделать закладку в хроме?

     ответов: 4   2025-12-07 14:13:22 (#3715314)

[TC] не могу добавить некоторые рсс ленты в thunderbird.

здравствуйте.

при добавлении некоторых рсс лент в thunderbird выдаёт такую ошибку.

Thunderbird не может установить защищённое соединение с сайтом
spbdnevnik.ru, так как
сайт использует протокол безопасности, который был отключён.

некоторые добавляются нормально.

можно ли как-то этот отключённый протокол включить или никак это не обойти?

спасибо.

-- с уважением андрей
моя почта
priyomn***@g*****.com

     ответов: 0   2025-12-07 08:46:05 (#3715324)

[TC] программа "Soft Organizer"

Добрый день, уважаемые друзья. Установил указанную в теме программу, но
в ней озвучивается только заголовок окна. Можно ли как-то настроить Jaws
или NVDA для озвучивания внутреннего содержимого окна данной программы,
или может скрипты существуют? Поделитесь информацией, у кого она есть.
Буду благодарен и признателен.

     ответов: 0   2025-12-07 06:31:22 (#3715323)

[TC] как установить windows 11 с флешки вслепую?

Доброго утра рассылчанам. Я мог установить windows 10 с помощью утилиты Accessible_boot_manager. а как устанавливать windows 11 с флешки вслепую? Кто уже это делал - подскажите. С уважением - николай.

     ответов: 3   2025-12-06 13:22:02 (#3715299)

[TC] нужен RadioBox

Всем привет.

Поделитесь, кто может, работающей программой RadioBox.
Заранее благодарю.

С уважением, Владимир

     ответов: 1   2025-12-04 09:52:57 (#3715263)

[TC] yовый ссд

Здравствуйте.
У родственника есть хороший игровой компьютер, но с hdd диском.Давно им
не пользовался, начал тормозить, я предложил переустановить систему. Он
переустановил, все хорошо, немного притормаживает из за hdd. Ну я
посоветовал купить ссд.
Купил, поставил , диск сата. Поставил вторым диском и начал
устанавливать 10.Не ставится открывается окно с выбором языка и дальше
ничего. Я посоветовал отключить старый hdd, оставить только ссд и
ставить на него. Опять выбор языка и дальше часики висят. Сегодня с утра
он мне написал, что на ссд система ставилась около 2 часов и после
перезагрузки получил сообщение Ошибка и код ошибки. Код ошибки он не
записал.Скажите, что мы делаем не так? Когда я добавлял себе ссд, я
просто подцепил его к компу и установил на него систему вообще не было
никаких проблем.
С уважением, Андрей.

     ответов: 1   2025-12-04 09:19:49 (#3715262)

[TC] Произношение ссылок в JAWS 2025

Всем привет.

Подскажите,, пожалуйста, можно ли сделать так, чтобы JAWS 2025 не произносил название ссылки, когда оно отличается от текста этой же ссылки?

Если я не понятно выразился, поясню на примере. Подобное очень часто встречается на Википедии, например в тексте "команда из Лондона" слово Лондона является ссылкой и JAWS 2025 произносит всю фразу как "команда из ссылка Лондона Лондон".

В более ранних версиях скринридера название ссылки, т.е. последнее слово Лондон не произносилось и я хотел бы вернуть данное поведение.

Заранее спасибо.

     ответов: 8   2025-12-03 20:00:57 (#3714381)

[TC] скрипты к total

Здравствуйте.

Есть ли скрипты к total11?
Просьба подкинуть.

С. Бабич.

Улыбнись!

Женщина, которая ценит себя слишком низко - сбивает цену всех остальных

     ответов: 0   2025-12-03 17:37:06 (#3715252)

[TC] 2 вопроса по jaws

Всем здравия.
Установил jaws for windows и возникло 2 вопроса. 1. Как сделать, чтобы
Русский текст читался Русским синтезатором, а Английский соответственно
Английским? 2. Как можно ускорить речь голосов rh-voice под sapi5, если
и на 100 процентах он говорит еще медленновато?
С уважением Андрей.

     ответов: 3   2025-12-03 06:46:05 (#3715218)

[TC] предупреждение сандерберд

здравствуйте.

при просмотре списка сообщений сандерберд на некоторых сообщает следующие:

внимание! сандерберд считает это сообщение спамом

подскажите пожалуйста,где это отключается?

Роман.

     ответов: 2   2025-11-30 13:36:31 (#3715122)

[TC] Нужна программа lbdb

Здравия Николай.
Вот прямая ссылка: http://lbdb.tiflohost.ru/lbdb/lbdb.rar
С уважением Андрей.
Николай написал: Нужна последняя версия программы lbdb, поскольку моя при
попытке получить файл выдаёт ошибку, что хост не отвечает

     ответов: 0   2025-11-30 10:21:38 (#3715179)