Tytuł: Sztuczna inteligencja przeczyta każdą książkę głosem Krystyny Czubówny. Tak zmienia się branża audio
Autor: Anna Anagnostopulu / Business Insider Polska
Źródło: https://businessinsider.com.pl/biznes/sztuczna-inteligencja-przeczyta-ka...
Data publikacji: 30.08.2022
/.../ Audiobooka można wyprodukować już za 5 tys. zł, ale są i takie, których budżety przekraczają 100 tys. Bardzo istotną składową sukcesu danej produkcji jest lektor. Być może już niedługo sztuczna inteligencja będzie w stanie przeczytać każdą książkę głosem naszego ulubionego aktora. O branży audio rozmawiamy z Arkadiuszem Seidlerem, prezesem Audioteki.
Anna Anagnostopulu, Business Insider Polska: Czego słuchamy najchętniej i czy gusta słuchaczy pokrywają się z czytelniczymi? W najpopularniejszych produkcjach Audioteki widzę Kena Folleta, Vincenta Severskiego i Wojciecha Chmielarza. A potem są Bracia Karamazow i Harry Potter.
Arkadiusz Seidler, prezes Audioteki: Z dużą dozą prawdopodobieństwa można założyć, że to, co jest popularne w wydaniach drukowanych, będzie również popularne w audio. Na szczycie listy Audioteki znajdują się tytuły z topki rankingów czytelniczych oraz te, które wydajemy jako superprodukcje. I tak, na przykład "Braci Karamazow" Fiodora Dostojewskiego czy "Świat bez końca" Kena Folleta zrealizowaliśmy w formie słuchowiska. Takie formaty mają bardzo duże budżety, gwiazdorską obsadę i bardziej przypominają produkcje filmowe.
Duże budżety, czyli jakie? Ile kosztuje wyprodukowanie klasycznego audiobooka? W artykule Michała Szafrańskiego, który opisywał swoją współpracę z Audioteką, znalazłam kwotę 10 tys. zł, z czego 5 tys. zł to koszt studia i przygotowania do dystrybucji, a na 5 tys. zł została wyceniona jego praca jako lektora.
Koszt nagrania tzw. single voice’a zależy od dwóch czynników: długości tekstu i doboru lektora. Uśredniając powiedziałbym, że to od 5 do 10 tys. zł. Książka Michała Szafrańskiego była dość obszerna, co ma wpływ na długość nagrywania audiobooka, a więc czas pracy lektora i koszt wynajęcia studia. Nagranie krótszej beletrystyki z dobrym, choć mało znanym aktorem teatralnym, to koszt ok. 5-6 tys. zł.
Jeśli chodzi o superprodukcje, to nieskromnie powiem, że nie udało nam się zrealizować żadnej poniżej 100 tys. zł. Każdorazowo zatrudniamy od kilkunastu do kilkudziesięciu aktorów, zazwyczaj to gwiazdy kina i telewizji, które swój czas wyceniają porównywalnie do tego spędzanego na planie filmowym. Do tego dochodzą efekty specjalne oraz muzyka, komponowana na potrzeby słuchowiska. Wreszcie sam montaż takiej produkcji jest o wiele bardziej skomplikowany i trwa po prostu dłużej.
/.../ A jak istotny jest lektor? Czy klientom zależy na gwiazdach, a fakt, że audiobooka czyta Maciej Stuhr albo Krystyna Czubówna, robi różnicę w popularności tytułu?
Tak, zdecydowanie klienci doceniają znane głosy. Wszyscy przecież chcemy, by audiobooka przeczytał nam ktoś, kogo znamy i lubimy. Jednak jeszcze ważniejszym aspektem niż znane nazwisko jest warsztat aktorski. Pamiętajmy przy tym, że przeczytać audiobooka wcale nie jest łatwo. Głos się męczy i nawet wyćwiczony aktor nie jest w stanie utrzymać tego samego tempa, dykcji czy wyrazistości przez kilkanaście godzin. Książkę, która, przykładowo, ma 10 godzin gotowego materiału, czyta się dwa razy dłużej. Samo nagranie trwa około dwóch tygodni, aktorów umawiamy na sesje po kilka godzin dziennie.
Na rynek audio wchodzi już sztuczna inteligencja. Czy jest możliwe, że z czasem zastąpi lektorów?
W rozwoju technologii, a co za tym idzie także wykorzystaniu AI przy produkcji audiobooków, widzę zarówno szanse, jak i zagrożenia dla branży. Już teraz niektóre typy literatury są czytane przez sztuczną inteligencję. To przede wszystkim treści prawnicze, których użytkownikami są najczęściej studenci uczący się do egzaminów. Jak twierdzą, interpretacja aktorska tylko przeszkadzałaby im w odbiorze, a bezosobowy głos pomaga zapamiętać treść.
Jednak są także firmy, które bardzo aktywnie prowadzą testy nad wykorzystaniem algorytmów AI, by w pełni zastąpić aktora także przy innych typach literatury. Jak twierdzą ich przedstawiciele, wystarczy około 30 tys. słów wypowiedzianych głosem danej osoby, by ten sam głos przeczytał potem dowolny nowy tekst. Oczywiście pozostaje wciąż kwestia interpretacji czy emocji wkładanych w czytaną treść przez aktora, niemniej sądzę, że to tylko kwestia czasu, gdy algorytmy AI będą potrafiły te emocje odtworzyć.
Czyli pani Krystyna Czubówna będzie inkasowała tylko tantiemy za odtworzenia.
Na razie prawo autorskie nie nadąża za rozwojem technologii. Możemy sobie jednak wyobrazić, że zamawiamy wszystkie swoje ulubione książki przeczytane głosem Krystyny Czubówny, a ona nie musi nawet pojawić się w studio. Udziela licencji i odbiera tantiemy. Tylko czy to w efekcie nie doprowadzi do sytuacji, w której aktorzy nie będą już zupełnie potrzebni?
Nieżyjący już Tomasz Knapik, który był głosem warszawskich tramwajów i autobusów, pytał nas kiedyś o radę. Został bowiem poproszony o nagranie nazw przystanków, które dopiero miały powstać. Ostatecznie zdecydował, że nie udzieli swojego głosu do tego projektu. Uznał, że właśnie wtedy go wspomnimy, gdy podczas wysiadania z tramwaju zabraknie jego znajomego głosu.
Więcej w pełnym tekście wywiadu na Business Insider Polska.
Brak komentarzy