W najnowszym wystąpieniu na Reddit, Sam Altman wraz z innymi przedstawicielami OpenAI podzielił się kluczowymi przemyśleniami na temat przyszłości AI. Sesja AMA (Ask Me Anything) dostarczyła cennych informacji o planach rozwoju i kierunkach badań.
W kontekście rozwoju modeli językowych, OpenAI potwierdziło, że nie planuje w tym roku wydania GPT-5, koncentrując się zamiast tego na usprawnianiu serii modeli o1 i ich kolejnych wersji. Ta decyzja pokazuje strategiczne podejście firmy do rozwoju technologii.
Szczególną uwagę poświęcono kwestii okien kontekstowych. OpenAI pracuje nad zwiększeniem limitu tokenów dla ChatGPT Plus i GPT-4o, uznając obecny limit 32k tokenów za niewystarczający dla bardziej złożonych zadań.
W obszarze modeli obrazowych i funkcji „Render” z GPT-4o, firma prowadzi intensywne prace nad nowym modelem tekst-do-obrazu. Modele o1 będą wspierać wejście obrazowe i multimodalność w nadchodzących miesiącach.
Porównując z konkurencyjnymi rozwiązaniami, SearchGPT wykazuje 40% wyższą skuteczność w złożonych zapytaniach niż tradycyjne wyszukiwarki. OpenAI planuje dalszy rozwój tej technologii, z możliwością generowania dynamicznych stron internetowych w odpowiedzi na zapytania.
W kontekście trybu głosowego (AVM), firma pracuje nad poluzowaniem ograniczeń muzycznych, w tym możliwością generowania śpiewu przez ChatGPT. Funkcje takie jak tryb Advanced Voice Mode z wizją i trybem kamery są w fazie rozwoju.
Szczególnie interesująco przedstawiają się plany dotyczące agentów AI, które mają być kluczowym elementem rozwoju w 2025 roku. OpenAI przewiduje, że do tego czasu większość benchmarków w tej dziedzinie zostanie nasycona.
W kwestiach etycznych i regulacyjnych, firma potwierdza swoje zaangażowanie w przestrzeganie polityk UE, jednocześnie wyrażając nadzieję na rozwój coraz bardziej rozsądnych regulacji.
Dodaj komentarz