Řešení pro přepis textů s citlivým obsahem?

Publikováno: 23. února 2024 | autor Redakce
AI řešení přepisu řeči hl

Čeští vývojáři vyvinuli unikátní AI řešení pro přepis textů s citlivým obsahem

·         PIXLA je on-premise řešení pro přepis mluveného slova do textu, poradí si s více než 30 jazyky, má ambice do zahraničí

·         PIXLA cílí na organizace pracující s citlivými texty, datově objemnými soubory k přepisu a na firmy, které potřebují přepsat velmi velké množství textu

·         Rozpoznání řeči je optimalizováno a trénováno na akademické a odborné texty využívající právní, zdravotnické a historické termíny

V době, kdy se většina vývojářů soustředí téměř výhradně na cloudová řešení, se společnost Venlan věnovala vývoji specifického komplexního on-premise řešení AI Transriber PIXLA určeného pro přepis mluveného slova do textu. Díky unikátnímu konceptu, který pracuje výhradně s daty uvnitř zabezpečené sítě zákazníka, cílí projekt na subjekty pracující s přísně důvěrnými či datově velmi objemnými soubory.  Vzhledem k multijazyčnosti má toto nové řešení ambice proniknout nejen na lokální trh, ale také do zemí Evropské unie. Ohlasy na pilotní testování projektu je velmi úspěšné.

AI řešení přepisu řeči

Přepis řeči není žádnou novinkou. Aktuálně dostupná řešení však pracují jako cloudové služby. To znamená, že pro převod mluveného slova do textu je třeba odeslat zdrojový audio nebo video soubor do cloudu, kde je využíváno úložiště a výpočetní výkon třetích stran. Zadavatel pak zpravidla platí podle časové délky zdrojového audiovizuálního souboru. Tento postup je pro řadu potřeb a společností plně vyhovující. Jsou zde však i instituce, jejichž data jsou buď velmi citlivá, nebo potřebují převádět pravidelně velké množství mluveného slova. Příkladem mohou být soudy, státní či městské úřady, nemocnice, callcentra nebo například televizní a rozhlasové stanice.

„Při vývoji Venlan AI Transriber PIXLA jsme se zaměřili na specifickou cílovou skupinu uživatelů a jim jsme přizpůsobili nejen celkové řešení, jehož součástí je i hardwarová „piksla“, ale i proces učení transkripce, které časově zabralo největší část vývoje. Troufám si proto tvrdit, že náš produkt nabízí nejlepší výsledky při převodu akademických textů plných odborných termínů z právní praxe, zdravotnictví, či například historie,“ popisuje svůj AI produkt Vladislav Janeček, jednatel společnosti Venlan.

PIXLA si poradí s přepisem textu z audiovizuálních souborů obsahujících mluvené slovo ve více než 30 jazycích, přičemž základ tvoří všechny jazyky používané v EU. Díky využití pokročilých nástrojů umělé inteligence využívá nejen rozpoznávání slov či hlásek, ale při převodu bere v úvahu i kontext konkrétního textu. Díky tomu je výsledkem přirozeně znějící text, který se velmi blíží původnímu vzoru a současně jsou do značné míry eliminovány přeřeknutí, odkašlání nebo často se opakující citoslovce (éééé, áááá atd.).

Přepis 7hodinového záznamu za 40 minut

Základem on-premise řešení Venlan AI Transriber PIXLA je hardwarové zařízení určené k instalaci do infrastruktury vnitřní zabezpečené sítě. Ovládání je velmi snadné, pomocí správce souborů stačí přetáhnout audiovizuální soubor do okna aplikace, která zajistí jeho zkopírování do zabezpečeného úložiště PIXLY, kde je zvuk pomocí integrovaných výpočetních prostředků převeden na text a soubor je následně automaticky smazán. Z videí získá uživatel kromě čistého textu také soubor typu .srt s předpřipravenými titulky. Části textu, kterým transcriber dobře nerozuměl, jsou barevně zvýrazněny. Aplikace je k dispozici pro operační systémy Windows, macOS i Linux. Kromě toho lze systém integrovat i přímo do firemního systému či spisové služby pomocí protokolu restAPI.

Výsledky převodu jsou k dispozici během okamžiku. Praktické zkušenosti získané v rámci jedné z pilotních testovacích instalací na vybraných magistrátech a univerzitách ukazují, že například převod sedmihodinového zvukového záznamu s účastí několika osob trvá pomocí Venlan AI Transriber PIXLA méně než jednu hodinu.

Dobře si poradí i s ruchy

Přesto, že možnosti převodu závisí na kvalitě zvukového záznamu, si transcriber díky precizní práci vývojářů při učení poradí dobře i s nežádoucími ruchy v záznamu.

Technologie PIXLA pomáhá neslyšícím

Aktuální čerstvou novinkou implementovanou do řešení Venlan AIT Pixla je převod hlasu do textu v reálném čase. Prostřednictvím aplikace běžící na počítači uživatele nebo na mobilním telefonu se systémem Android* je možné převádět na text zvukový záznam snímaný vestavěným mikrofonem nebo pomocí jiného kompatibilního připojeného audio zařízení. Tuto funkci lze vhodně využít například pro diktování lékařských zpráv nebo titulkování mluvčích na konferencích.

Tato technologie stojí také za projektem Neslyším-rádio.cz (https://neslysim-radio.cz ), která dává neslyšícím možnost číst v reálném čase živý přepis rozhlasového vysílání běžně dostupného v celoplošné rozhlasové síti DAB.

AI řešení přepisu řeči in

Cloudová PIXLA se stává hitem mezi tiktokery

Technologie a modely Venlan AI Transriber PIXLA jsou k dispozici také jako cloudová služba, která se díky kvalitě převodu a bezplatnému využití pro záznamy do jedné minuty stává oblíbeným nástrojem pro titulkování krátkých videí tiktokerů a dalších tvůrců audiovizuálního obsahu. I tuto službu je však možné využít pro převod libovolně dlouhých či datově obsáhlých souborů.

* aplikace prochází schvalováním v Google Play Store

Další informace včetně základního ceníku najdete na https://ait.venlan.cz/


Právě vychází
fv05-24-obalka-web3.jpg
Tento web používá k poskytování služeb soubory cookie.