Розшифровка за допомогою Speech to text відео з окремих каналів YouTube

Розшифровка за допомогою Speech to text відео з окремих каналів YouTube

ЗапитанняВідповідь
Які канали YouTube отримують авторозшифровку?Відео на відібраних нами каналах YouTube розшифровуємо автоматично за допомогою технології Speech-to-text. Розшифровуємо відео тривалістю не більше 90 хвилин. Якщо у відібраному каналі у деяких чи всіх відео є автоматичні субтитри, створені YouTube, то система сканує ці субтитри.
Я хочу отримувати авторозшифровки від конкретного каналу  YouTube, як це зробити?Зараз система розшифровує тільки відібрані канали.
Як шукати свою компанію/об'єкт моніторингу в авторозшифровках?Потрібно враховувати, що в авторозшифровках з української та російської мов англомовні назви компаній (латиниця) будуть записані кирилицею, можуть бути помилки в тарнскрипції таких слів.
Якими мовами відбувається авторозшифровка?Українською, російською та англійською.
Чому текст авторозшифровки суцільний, без ком і речень?Це автоматична розшифровка тексту, механізм її роботи заснований на машинному переведенні аудіо в текст, в такому форматі, на жаль, неможливо враховувати розділові знаки і великі літери. Всі слова записуються з маленької літери, в т.ч. власні імена.
За якими типами ЗМІ приходять авторозшифровки?По ТБ, а також по обраним каналам YouTube.
Відео від каналу YouTube, який підключений до авторозшифровок, відразу отримує розшифровку Speech to text?Ні, спочатку відео просто приходить в акаунт як відео, а пізніше доповнюється розшифровкою. Займає це до 30 хвилин з моменту появи відео в системі. Тому для того, щоб отримувати розсилки за цим параметром, рекомендується в налаштуваннях вибирати пункт "в режимі реального часу". Тоді такі відео будуть потрапляти в розсилку не за часом самого відео, а за фактом отримання текстової розшифровки.
Які канали YouTube зараз отримують авторозшифровку Speech to text?Ми відібрали ТОП-канали по Україні з новинним контентом - переважно сторінки національних ТБ-каналів, - і піключили їх до розшифровки за допомогою Speech to text.
Чому в авторозшифровках іноді визначаються автоматично персони / бренди і організації / географічні назви, а іноді - ні?Автоматично персони / бренди і організації / географічні назви визначаються в таких текстах, в яких вони вірно написані, тобто присутні заголовні букви тощо. В автоматично розшифрованих текстах великих літер немає, тому автоматично суті не визначаються. Вони визначаються в заголовку відео, в описі під відео, якщо він є. Для більш точного визначення потрібних сутностей, можна скористатися автотегуванням, для налаштування - зверніться до свого менеджера.

Гарного користування системою Semantrum!



    • Related Articles

    • Розшифровка за допомогою Speech to text відео з окремих каналів YouTube

      Система Semantrum істотно спрощує процес відстеження інформації, що вас цікавить, яка з'являється на певних каналах YouTube. Тепер всі відео окремих YouTube каналів тривалістю до 1,5 годин розшифровуються в текстовий формат. Розшифровуються ...
    • Характеристики джерел: тематика джерела

      Тематика джерела - це ті сфери, що він переважно описує, або інша характеристика джерела за його спрямованістю або приналежністю до якоїсь групи джерел. За тематиками ЗМІ в налаштуваннях теми або в фільтрах можна обрати джерела, наприклад, тільки ...
    • Характеристики джерел: категорія джерела

      Категорія джерела – характеристика джерела, яка деталізує тип джерела. Найбільше деталізацій стосується web-джерел. За тематиками ЗМІ в налаштуваннях теми або в фільтрах можна обрати джерела, наприклад, сайти ТВ-каналів або сайти офіційних органів ...
    • Моніторинг соцмереж

      Соцмережі, які моніторить Semantrum: Facebook Youtube Twitter Instagram Telegram TikTok LinkedIn Кожна соцмережа сканується по-різному, в залежності від її структури та технічних обмежень. Моніториться тільки відкрита інформація. Із соцмереж ...
    • Групування тегів за допомогою префіксів

      Групування тегів за допомогою префіксів Теги можуть групуватися за наявності у назві т.зв. префікса тега - слова або кількох слів, після яких стоїть двокрапка і далі назва тега. Цей префікс є назва групи тегів. Групування тегів дозволяє вам: бачити у ...