Twój koszyk jest pusty ...
Strona główna » Blog IT » OpenAI wreszcie daje ChatGPT oczy i uszy
Kontakt
  • Yeto Sp. z o.o. Serwis laptopów i komputerów Poznań. Serwis Lenovo, Dell, HP, Asus, Toshiba, Acer, MSI, Sony, Samsung, Xiaomi, Microsoft, Gigabyte, Razer, LG, Huawei, PEAQ. Sklep komputerowy: akcesoria, laptopy, zasilacze, baterie. Ul. Stablewskiego 3 60-224 Poznań (wjazd między garażami) lub od Łukaszewicza 44 (vis a vis Biedronki-parking) Od 07.30 do 19.30, także weekendy.
    NIP: 7792533766
  • E-mail:serwis@yeto.pl
  • Telefon732-900-555
  • Godziny działania sklepuZgłoszenia napraw domowych codziennie 07.30 - 19.30. Przyjęcia sprzętu w zakładzie od 07.30 do 19.30 Darmowy parking przed serwisem lub pod Biedronką na Łukaszewicza 44 vis a vis serwisu. Przyjmujemy także w weekendy.

OpenAI wreszcie daje ChatGPT oczy i uszy

Data dodania: 26-09-2023


OpenAI wreszcie daje ChatGPT oczy i uszy

 

ChatGPT z głosem i obrazem
ChatGPT z głosem

 

 

Witamy w świecie multimodalnej rewolucji ChatGPT

Wkrótce usłyszysz wiele o „wyszukiwaniu obrazów ChatGPT” i „głosach ChatGPT”. Ponieważ popularny chatbot AI nie jest już towarzyszem, który po cichu żyje w karcie przeglądarki. OpenAI właśnie ogłosiło, że ChatGPT może teraz widzieć, słyszeć i mówić. Oczywiście, jeśli jesteś subskrybentem ChatGPT Plus lub Enterprise .

Nadszedł czas, aby powitać nową erę interakcji, ponieważ ChatGPT robi kolejny krok, zyskując możliwość działania nie tylko w oparciu o tekst. Wyobraź sobie rozmowę ze swoim asystentem AI lub pokazywanie mu obrazów, aby wywołać dyskusje, o których nigdy nie myślałeś, że są możliwe. To już nie jest science fiction; to niezwykła rzeczywistość stworzona przez OpenAI. Przygotuj się na zanurzenie się w przyszłość sztucznej inteligencji, gdzie słowa, głosy i obrazy zbiegają się w symfonię innowacji i możliwości. Jeśli zastanawiasz się, jak będą działać te nowe funkcje, oto wyjaśnienie.
Ewolucja ChatGPT OpenAI
ChatGPT z rozmachem wkracza w przyszłość. Czy kiedykolwiek potrzebowałeś pomocnika AI, który przeszedł od zwykłego czytania Twoich wiadomości do rozmów, słuchania, a nawet sprawdzania Twoich zdjęć? To tak, jakby mieć znajomego, który zna się na technologii, który może opowiadać Ci historie na dobranoc, przyłączać się do debat przy kolacji i rozumieć chaos w Twojej lodówce, a wszystko to za pomocą szybkiego zdjęcia.

To nie tylko aktualizacja; może to być „kamień milowy”, którego ChatGPT szuka od jakiegoś czasu. Dzięki możliwościom widzenia, słyszenia i mówienia OpenAI wydaje się być pierwszym wyborem, gdy pojawi się pytanie
Co się stanie, jeśli te funkcje zostaną wykorzystane w złośliwych celach? OpenAI ostrożnie wdraża te supermoce, upewniając się, że zostaną one wykorzystane na dobre. Technologia głosowa, która może przygotować głosy brzmiące tak samo jak my, zaczyna się od przyjaznych zastosowań, takich jak czat i tłumaczenie. Jeśli chodzi o obrazy, nauczyli się z aplikacji dla osób z problemami wzrokowymi, jak szanować prywatność. Dzięki jasnym zasadom i poradom OpenAI chce, aby ChatGPT był Twoim zaufanym pomocnikiem, tutaj, aby rozmawiać, pomagać i informować w najbardziej wyluzowany i odpowiedzialny sposób. Niedawno OpenAI ogłosiło, że generowanie obrazów AI pojawi się również w ChatGPT za pomocą DALLE-3 . Musimy wspomnieć, że we wczesnym porównaniu DALL-E 3 z Midjourney , DALLE-3 pokonuje Midjourney.
Rozmowy głosowe ChatGPT: Twój towarzysz AI zabiera głos
Wyobraź sobie, że prowadzisz prawdziwą rozmowę ze swoim asystentem AI. Dzięki nowym możliwościom rozmów głosowych ChatGPT to marzenie stało się teraz rzeczywistością. Niezależnie od tego, czy jesteś w ruchu, szukasz bajki na dobranoc dla swoich dzieci, czy też rozstrzygasz ożywioną debatę przy stole, ChatGPT może prowadzić płynne, powtarzające się rozmowy głosowe.

Jak korzystać z głosów ChatGPT

Oto przewodnik krok po kroku, jak aktywować funkcję głosową ChatGPT:
Otwórz aplikację mobilną: Najpierw upewnij się, że masz zainstalowaną aplikację mobilną ChatGPT na swoim urządzeniu. Jeśli jeszcze tego nie zrobiłeś, pobierz i zainstaluj ją ze swojego sklepu z aplikacjami.
Dostęp do ustawień: Uruchom aplikację ChatGPT i w interfejsie aplikacji poszukaj opcji „Ustawienia”. Zwykle jest reprezentowana przez ikonę koła zębatego lub koła zębatego.
Rozmowy głosowe: w menu Ustawienia znajdziesz różne opcje i preferencje. Poszukaj opcji „Rozmowy głosowe” lub czegoś podobnego. Tutaj zaczyna się magia.
Rejestracja: Wybierz opcję „Rozmowy głosowe”, a prawdopodobnie zostaniesz poproszony o wyrażenie zgody na tę funkcję. Potwierdź swój wybór, aby włączyć interakcję głosową z ChatGPT.
Wybierz swój głos: po wyrażeniu zgody będziesz mieć możliwość wybrania preferowanego głosu z szeregu opcji. ChatGPT oferuje pięć różnych głosów do wyboru. Wybierz ten, który do Ciebie pasuje lub odpowiada Twoim preferencjom.
Doświadcz dźwięku podobnego do ludzkiego: teraz możliwości głosowe ChatGPT są gotowe do użycia. Kiedy prowadzisz rozmowę głosową, do działania zaczyna działać najnowocześniejszy model zamiany tekstu na mowę. Wymaga wprowadzonego tekstu i krótkiej próbki dźwięku, a następnie splata je w celu uzyskania zdumiewająco podobnego do ludzkiego dźwięku.
Stworzone przez profesjonalistów: OpenAI dołożyło wszelkich starań, aby zapewnić naturalne i przyjemne doświadczenie. Aby stworzyć te głosy, współpracowali z profesjonalnymi aktorami głosowymi, gwarantując, że Twoje rozmowy brzmią tak autentycznie, jak to tylko możliwe.
Transkrypcja tekstu szeptem: Aby ułatwić płynną komunikację, OpenAI wykorzystuje Whisper, system rozpoznawania mowy typu open source. Słucha Twoich wypowiadanych słów i fachowo transkrybuje je na tekst, umożliwiając ChatGPT zrozumienie i skuteczną reakcję.
Wykonując te kroki, będziesz mógł cieszyć się wciągającymi rozmowami głosowymi za pomocą ChatGPT, wykorzystując moc najnowocześniejszej technologii AI i fachowo spreparowanych głosów, aby zapewnić naprawdę wciągające wrażenia.
Nowa technologia głosowa, zdolna do tworzenia realistycznych, syntetycznych głosów, oferuje ogromny potencjał kreatywności i dostępności. Aby ograniczyć ryzyko, OpenAI początkowo wdraża tę technologię do czatów głosowych, współpracując bezpośrednio z aktorami głosowymi i partnerami, takimi jak Spotify, w zakresie odpowiedzialnych zastosowań, takich jak tłumaczenie głosowe.

Wyszukiwanie obrazów ChatGPT: nowy wymiar wizualny

Jakby tego było mało, ChatGPT jest teraz także atrakcyjny wizualnie. Dzięki wyszukiwaniu obrazów ChatGPT możesz wyświetlić jeden lub wiele obrazów, otwierając świat możliwości. Rozwiąż problemy z nieprawidłowo działającym grillem, zaplanuj obiad, przeglądając zawartość lodówki i spiżarni lub analizuj złożone wykresy pod kątem danych związanych z pracą. Aplikacja mobilna oferuje nawet narzędzie do rysowania umożliwiające wskazanie konkretnych szczegółów obrazu.
Funkcja wyszukiwania obrazów ChatGPT jest obsługiwana przez multimodalne modele GPT-3.5 i GPT-4, które wykorzystują swoje niezwykłe umiejętności rozumowania językowego do szerokiej gamy treści wizualnych, w tym zdjęć, zrzutów ekranu i dokumentów łączących tekst i obrazy.

Wyszukiwanie obrazów ChatGPT niesie ze sobą własny zestaw wyzwań, od halucynacji po interpretacje o wysokiej stawce. OpenAI dokładnie przetestowało te modele z czerwonymi zespołami i testerami alfa, aby ustalić kluczowe środki bezpieczeństwa. Rzeczywiste użytkowanie i opinie użytkowników będą miały kluczowe znaczenie w dalszym ulepszaniu tych zabezpieczeń.

Wyszukiwanie obrazów ChatGPT, głosy ChatGPT i więcej: daty wydania, których należy szukać

Wyszukiwanie obrazów ChatGPT, głosy ChatGPT i inne nowe funkcje zostaną początkowo udostępnione użytkownikom Plus i Enterprise w nadchodzących tygodniach. Programiści i inne grupy wkrótce będą miały okazję wykorzystać pełny potencjał ulepszonych możliwości ChatGPT.

Podsumowując , ewolucja ChatGPT w multimodalną sztuczną inteligencję stanowi znaczący krok w kierunku uczynienia sztucznej inteligencji bardziej powiązaną i wszechstronną. Dzięki mocy głosu i obrazu ChatGPT może stać się niezastąpionym towarzyszem w naszym codziennym życiu, zapewniając pomoc i spostrzeżenia w sposób, o jakim tylko marzyliśmy. Ponieważ OpenAI w dalszym ciągu priorytetowo traktuje bezpieczeństwo, przejrzystość i odpowiedzialne użytkowanie, przyszłość interakcji opartych na sztucznej inteligencji wygląda jeszcze lepiej.
 


Przejdź do strony głównej Wróć do kategorii Blog IT
Korzystanie z tej witryny oznacza wyrażenie zgody na wykorzystanie plików cookies. Więcej informacji możesz znaleźć w naszej Polityce Cookies.
Nie pokazuj więcej tego komunikatu