Бейнені тану, 50 тілде байланысу және 0,3 секундта жауап беру: OpenAI GPT-4o енгізді
Бейнені тану, 50 тілде байланысу және 0,3 секундта жауап беру: OpenAI GPT-4o енгізді
1 ай бұрын 898 Материалды көшіріп басқан жағдайда islam.kz порталына сілтеме берілуі міндетті

OpenAI GPT-4o жаңа генеративті моделін жұртшылық ұсынды. Бұл жайында islam.kz порталы nplus1 ақпарат көзіне сілтеме жасай отырып мәлім етеді. Ол бейнемен жұмыс істей алады, пайдаланушымен 50 тілде дауыстап тілдесе алады және түрлі интонацияларға, сыбырлауға, ән айтуға және күлуге еліктей алады немесе айнытпай сала алады. Сонымен қатар, модел алдыңғы нұсқаға қарағанда әлдеқайда жылдам жұмыс істейді. Дауыс режимінде жауап берудің кешігу уақыты орташа алғанда шамамен 0,3 секундты құрайды, бұл аралық адамның реакциясымен (дам жауап бермес бұрын пайда болатын реакциясы немесе эмоциясыне кететін уақыт) салыстыруға болады. Жаңа модел әлдеқайда жылдам жұмыс істеп қана қоймай, әңгімелесушінің интонациялары (дауыс екпіні) мен эмоцияларын (көңіл күйін) тани алады, сонымен қатар, синтезделген дауыстың күшін, тембрін, биіктігін және эмоционалдық бояуын өзгерте алады. Модел мысқылмен сөйлей алады, сыбырлайды, күледі, тіпті, ән салады. Әңгімелесуде модел өзін адам сияқты табиғи түрде ұстайды, қосымша ақпаратты қабылдайды және болып жатқан оқиғаның контекстін сақтай отырып, диалогты жалғастырады. GPT-4o тағы бір ерекшелігі - нақты уақыттағы бейнені қоса алғанда кескінді танидыы. Негізінде, модел кадрда не болып жатқанын сөзбе-сөз көріп, түсіндіре алады. OpenAI ChatGPT чат-ботында тегін пайдалану үшін GPT-4o ашады, алайда, белгілі бір уақытта сұраулар санына шектеулер қояды. Жаңа үлгінің мүмкіндіктері кезең-кезеңімен іске қосылады.

0 пікір
Мұрағат