Журналистам...и всем, кто пишет.
3111
26
Нужно мнение профессионалов.
Решил по серьезному потратиться и сделать диктофон, который всю записанную речь выдает в компьютер уже в текстовом формате, т.е. буквально за 2 секунды.

Когда-то помню журналист печатал все с диктофона в ручную. Как сейчас обстоят дела с этим? Серьезно пока не смотрели информацию, вроде что-то подобное есть, но не распространено.
В чем дело? Ведь это же безумно удобно?
Может кто сталкивался с подобными устройствами?
А кто не сталкивался - какие мнения будут?

Жду комментарии.
Romanchuk
Я люблю старый добрый традиционный кассетный (но маленький) диктофон. Просто потому что привыкла к нему. Раритетный такой... Каких только интересных интервью с него не писано... )))

Видите ли... Живая устная речь человека она настолько бывает сумбурной... Что если все как есть - слово в слово сразу перекинуть - получится натуральная каша. Когда прослушиваешь, уже сразу же форматируешь и выбрасываешь мусор... С диктофона на монитор переносишь далеко не все.
Romanchuk
Не всегда, в конечном результате информация с диктофона нужна в текстовом формате(радио, тв), но вполне подходит для печатных сми. На мой взгляд вашу идею автоматического распознавания речи для диктофонов можно решить програмно. Т.е. это бы была программа, подходящая для любых цифровых диктофонов, да и для любых аудиоисточников.(наверняка такая уже есть )
Romanchuk
Хочу Вас опечалить. Перевод аудиосигнала речи в текст, проблема на уровне создания искусственного интеллекта. Есть конечно программы которые пытаются, но в основном они все заточенный под определенный язык. И на сегодняшний день этот язык - английский. С русским "работает" Горыныч. Поищите в инете на форумах отзывы.
slux
Я думаю,тот ТС как раз и хочет создать диктофон(или, как я предложил прпограммное решение)с сильным искуственным интелектом для русского языка.Думаю это реально
Сергей25
Вы считаете, что ИИ уже создан? Тысячи ученых бьются несколько десятилетий, тратятся миллиарды, а Вы считаете, что диктофон с ИИ РЕАЛЬНО!!! Не верьте всему что показывают в кино.
slux
+1
Майкрософт уже несколько сотен миллионов нерублей в разработку влупила, а результаты пока более чем скромные.
К тому же кроме собственно системы интеллектуального распознавания речи (СИРР) существует и еще одна немаловажная проблема.
На сегодняшний день даже самые лучшие компактные мобильные системы записи звука, к коим относятся диктофоны, оснащены довольно слабыми (по сравнению со стационарными)устройствами входной обработки звука. Журналистам же часто приходится работать в далеко неидеальных условиях для записи. Не обеспечивают требуемого качества входного звука для нормального функционирования СИРР даже новейшие системы шумоподавления.
Учитывая эти и другие факторы, создание прототипа полностью работоспособной компактной системы распознавания и преобразования речи в текст в ближайшие 3-5 лет считаю маловероятным. Не говоря уже о серийном производстве.
slux
Вы считаете, что ИИ уже создан?
Мы пойдем другим путем.
Главное - нужно или нет.
Деньги я готов вкладывать. То, что мне предложили вполне для целей быстрого распознавания подойдет.
Если Вы о том, что машина не в состоянии выдавать слова, а будет сшлошной ряд букв - это верно. Но это уже действительно очень сложно.
Просто же упростить для журналиста работу вполне нам по силам.

Почему журналисты молчат? Нужно или нет? Я рынка не знаю, подскажите, покритикуйте.
yuson
создание прототипа полностью работоспособной компактной системы распознавания и преобразования речи в текст в ближайшие 3-5 лет считаю маловероятным.
Смотря что Вы под этой фразой подразумеваете.
Мы способны создать устройство, которое Вашу речь выдаст в тексте спшлошным рядом букв. Это неудобно, но мы будем работать.
Romanchuk
Не совсем понял вопроса-в чём вопрос-то?
Купили ли бы вы такой диктофон?
Интересная ли идея?
Пользовались ли бы вы таким диктофоном?
В чём вопрос?
Romanchuk
Я подразумеваю создание портативного (подчеркиваю, именно карманного!) устройства, способного с расстояния от 1 до 5 метров в окружающей звуковой среде от 15-20 дб. до примерно 35-40 дб. адекватно распознавать речь произвольно взятого человека и конвертировать ее в текстовой файл.
Если подобное устройство окажется Вам под силу - смело готовьте фантазию на предмет того, куда тратить заработанные деньги.
Romanchuk
Почему журналисты молчат?
Возможно потому... Что для журналиста самое ценное и сложное - найти достойный источник информации ))) А если ты до него уже добрался... до бесценной звезды чего-то там... то уже не столь важно каким инструментом воспользуешься... Цифровым... Кассетным... Да хоть ручкой с бумажкой... Это уже второстепенно )))
yuson
А, собственно, к чему журналисты-то? Рынок ведь специфический и весьма узкий. Глядите шире!
Если сможете решить главную проблему конвертации речи в текст,то, оснастив такое устройство несложным процессором и модулем синтезирования речи, получите голосовой карманный переводчик, примерно такой, какой был у героев советского фантастического блокбастера "Москва-Кассиопея". Это, с точки зрения рыночной перспективы, покруче будет, чем какой-то там диктофон!
Впрочем, пока что это - такая же фантастика :злорадство:
yuson
Тут ведь вот еще какое дело...
В большинстве своем люди в реальной жизни говорят довольно коряво. Употребляют массу междометий, вводных слов, а то и просто "мыкаю", "экают" и т.д. То есть даже если программа сможет все точно распознать, на выходе получится неудобоваримая каша, которую все равно придется редактировать.
И проще сделать это сразу - когда журналист (или кто там) расшифровывает записанный на диктофон текст.
Хотя, возможно, что когда-то всю эту работу сможет так же выполнять компьютер. Тогда уже и до тех благославенных времен, когда ПК будет сам писать тексты - рукой подать:)
Bato
Купили ли бы вы такой диктофон?
Пользовались ли бы вы таким диктофоном?
Эти 2 вопроса и еще один: что такой диктофон должен "уметь делать"?
cambrioleur
на выходе получится неудобоваримая каша
Пока так и есть.
Но если представить сл. ситуацию - Вы взяли интервью, Вам его расшифровывать часа 3-4.
А есть вариант править уже текст, ставя пробелы и добавляя буквы, которые не распознал диктофон.
Весь вопрос в удобстве.
Когда мне предложили эту идею я был под впечатлением. Мне показалось, что править текст - ерунда по сравнению с тем, чтобы по 100 раз слушать одно и тоже. А теперь выясняется, что оптимизма не много у пользователей.

По поводу внешней среды - думаю только закрытое помещение, без сильных шумов. На улице он будет бесполезен, как и на лекции, к примеру.
Romanchuk
по 100 раз слушать одно и тоже.
Слишком преувеличили )))
Обычно все куда как проще. Слушаешь фрагментом. Тут же пишешь. И может даже - двух раз достаточно... А можно даже с одного!
Восьмая_Марта
А можно даже с одного!
Восьмая Марта, Вы понимате, что своими сомнениями сейчас оставляете без работы целый завод почти? Люди думали я вложу деньги, а Вы меня мучаете. Я то думал и вправду хорошая идея.

Вот что значит рынка то не знать... :not_i:
Romanchuk
По поводу внешней среды - думаю только закрытое помещение, без сильных шумов. На улице он будет бесполезен, как и на лекции, к примеру.
При таком раскладе подобный гаджет будет востребован исключительно в качестве забавной игрушки, не более. Как рабочий инструмент с таким набором ограничений эта штуковина не годится, к сожалению.
Впрочем, начать можно с малого, а там, глядишь и решения сыщутся. Возможно даже простые и неожиданные. Вопрос только во времени и деньгах.
yuson
Впрочем, начать можно с малого, а там, глядишь и решения сыщутся.
Дело в том, что я привык выпускать на рынок законченный товар. Или хотя бы явно лучше того, что есть.
Работать с товаром долго, по пути устраняя неполадки, - не мой профиль. Если не смогу предложить то, что нужно человеку - просто не буду делать ерунду. Уж так я смотрю на все.
:secret:даже если абстрагироваться от пока не лучших технических возможностей подобных штук....а вспомнить, что пришел мир цивровых СМИ....печатка помирает, а та, что не помрет все равно будет заявзана с цифрой (инет-информ. HD видео площадки, интерактив, сопроводительные DVD / Блю рэй диски с инфой, как приложение и т.д. и т.п.), то становится совершенно понятно, что на черта журналистам такие вещи - если они уже могут, а cкоро смогут еще круче снимать видео в хорошем качестве на мобилу и выставлять в инет или куда-то еще :yes.gif:

поэтому мой вердикт - ниша утопична и ваше решение праивльное! :dnknow:
Romanchuk
Если не смогу предложить то, что нужно человеку - просто не буду делать ерунду. Уж так я смотрю на все.
Рад, что приведенные мной аргументы на сей счет поняты правильно.
Нет, сама идея вовсе не плоха. Вот только конечная цель вызывает вопросы. Тут уже сказали выше о том, что подобного рода устройство с некоторыми доработками может быть очень даже перспективно с маркетинговой точки зрения, но для этого надо ориентироваться на другой сектор спроса и четко понимать конечные цели. Вкладывать же деньги в любопытную, но весьма сырую идею, не имея маркетингового плана, по-моему мнению - риск совершенно ненужный. Тем паче, что более перспективных, на мой взгляд, инновационных разработок ожидающих финансирования, более, чем достаточно.
Romanchuk
есть вариант править уже текст, ставя пробелы и добавляя буквы, которые не распознал диктофон.
.......Мне показалось, что править текст - ерунда по сравнению с тем, чтобы по 100 раз слушать одно и тоже
полная ерунда

вы быстро печатаете на компьютере? нет?
а вот все журналисты - да

вообще для людей с нормальной скоростью печати править текст - пытка
по сравнению с тем, чтобы набрать его с нуля

попробуйте проведите эксперимент на время
сами все поймете
Adeli
Точно-точно. Как в прошлом верстальщик. Подтверждаю. Набирать с нуля быстрее, чем править "кашу".
Romanchuk
"Центр речевых технологий"- знакомое название?
если нет, в поиске наберите.
uhfdth
например: в том числе и про црт
Хорошая ссылка. Спасибо.
Я заинтересован в перспективных проектах и готов их финансировать, но, посмотрев проекты, понимаю почему у нас в стране сложно с коммерционализацией идей.

Но все равно спасибо.