OpenAI julkisti uudet puheenkäsittelymallit: GPT-Realtime-2, -Translate ja -Whisper

Danny Weber

OpenAI julkisti kolme uutta puheenkäsittelymallia: GPT-Realtime-2 (päättely), -Translate (käännös) ja -Whisper (transkriptio). API:n kautta.

OpenAI on julkistanut kolme uutta puheenkäsittelymalli: GPT-Realtime-2, GPT-Realtime-Translate ja GPT-Realtime-Whisper. Jokainen malli on räätälöity tiettyyn käyttötarkoitukseen, kuten keskusteluälykkyyteen, kääntämiseen tai puheentunnistukseen.

Julkaisun kärkenä on GPT-Realtime-2, lippulaivamalli, jossa on GPT-5-tasoinen päättelykyky ja jopa 128 000 tokenin konteksti-ikkuna. Suorituskyky on parantunut noin 11 prosenttia edeltäjään GPT-Realtime-1.5 -malliin verrattuna. Uusi malli käsittelee keskusteluja sujuvammin ja osaa lisätä selventäviä huomautuksia, suorittaa monta tehtävää samanaikaisesti ja kertoa pyynnön etenemisestä.

Mallissa on säädettävät päättelytasot minimaalisesta erittäin korkeaan, joten käyttäjä voi valita nopeuden ja laadun välillä. Zillowin live-testeissä GPT-Realtime-2 nosti onnistuneiden puheluiden määrän 69 prosentista 95 prosenttiin. Hinnoittelu on edelleen 32 dollaria miljoonalta äänisyötetokenilta ja 64 dollaria miljoonalta äänitulostetokenilta.

Toinen malli, GPT-Realtime-Translate, on tehty reaaliaikaiseen puhekäännöksenen. Se tukee yli 70:a lähdekieltä ja 13:a kohdekieltä ja säilyttää luonnollisen keskustelun rytmin ja rakenteen. BolnaAI:n testeissä käännösvirheiden määrä useilla intialaisilla kielillä laski 12,5 prosenttia. Mallin hinta on 0,034 dollaria minuutissa.

Kolmas malli, GPT-Realtime-Whisper, on tarkoitettu puheen suoratoistoon tekstiksi. Se on Whisper-perheen seuraaja, joka julkistettiin alun perin vuonna 2022. Malli tarjoaa lähes reaaliaikaista transkriptiota ja maksaa 0,017 dollaria minuutissa.

OpenAI kertoo suuntavansa nämä työkalut ääniavustajien, uuden sukupolven puhelinkeskusten ja synkronisten käännöspalveluiden kehittämiseen. Kaikki kolme mallia ovat nyt kehittäjien saatavilla API:n kautta, ja niissä on sisäänrakennetut sisältösuodattimet.

© RusPhotoBank