Vaše jednička mezi nulami
ITBiz.cz

Kniha od umělé inteligence – žádný zvláštní pokrok

Pavel Houser , 28. May 2019 10:30 0 komentářů

Ve vydavatelství Springer Nature byla vydána (a volně zpřístupněna) kniha o Li-Ion bateriích, kterou vygeneroval algoritmus. Počin je to jistě zajímavý a pochopitelně vzbudil slušnou pozornost. Můžeme nyní spekulovat, nakolik tento způsob publikace zefektivní produkci odborných textů (tj. nahradí/omezí práci redaktorů), nicméně čistě z hlediska pokroku technologií umělé inteligence nebo porozumění přirozenému jazyku o žádný zvláštní pokrok nejde.

Takový je alespoň verdikt většiny komentátorů a recenzentů. Algoritmus totiž knihu de facto „nenapsal“, pouze vybral články vztahující se k tématu, ty roztřídil/uspořádal, vybral z nich klíčové pasáže (abstrakty apod. už vědecké články obsahují, ty ani program nemusel vytvářet), vytvořil jakási propojení a vše doplnil o odkazy na zdroje jako celek. Asi málokdo bude takovou práci číst jako knihu, ani jako učebnici ne, pročež místy kostrbaté formulace příliš nevadí. Jako shrnutí odhazující na další zdroje je výsledek celkem monumentální, ale na to jsou k dispozici i jiné nástroje typu Google Schoolar. Text samozřejmě působí dobře, uceleně, ale to je dáno už tím, že koherentní a značně formalizované jsou už vstupní zdroje. Mnohem zajímavější by bylo, kdyby třeba na začátku stály pouze heslovité poznámky v bodech a algoritmus z nich měl zkusit generovat věty nebo dokonce věty určené k tomu, aby je lidé četli s potěšením.

V podstatě nejde o „první knihu napsanou počítačem“, a to bez ohledu na to, nakolik se to někomu povedlo již dříve (viz ony zprávy o tom, jak „počítač napsal román“). Jedná se o tvorbu souhrnu, která se zase tolik neliší od toho, když programy nahrazují novináře a generují zprávy o finančních výsledcích firem nebo o výsledcích sportovních. Text o lithiových bateriích je kvalitnější, protože kvalitnější jsou vstupní zdroje, jinak se od výše zmíněné žurnalistiky odlišuje především (jen?) rozsahem.

Vydavatelé berou projekt jako experimentální; leccos by jistě dokázali na textu vylepšit, ale záměrně to neudělali. Nadhazují otázky toho typu, jako je odpovědnost za případné chyby v podobně vzniklých materiálech (míněno spíš odpovědnost morální než právní, „kdo ručí svou odbornou pověstí“). Za poslední 3 roky nicméně bylo jen na téma Li-Ion baterií údajně publikováno v odborných recenzovaných časopisech přes 53 000 článků. Určitě se jedná o klíčovou technologii a i samotná automatizovaná sumarizace informací může mít ohromnou cenu. Nakolik podobné algoritmy a příručky zefektivní dalším výzkumníkům práci např. ve srovnání vyhledáváním dle klíčových slov? Nakolik algoritmu svěříme, že dokáže vybrat práce významné (seznam těch 53 000 odkazů asi nikomu příliš nepomůže, zde jich program do svého souhrnu zařadil asi 150). Jistěže zde jsou třeba citační indexy a věci typu Google PageRank, ale zde by práce algoritmu vůbec měla předcházet tomu, že text bude nějaký další vědec používat pro vlastní výzkum a citovat.

O nějakou „cestu ke skutečné umělé inteligenci“ se každopádně nejedná, ani tímto způsobem vědci neodkáží automaticky vytvářet vlastní odborné příspěvky (s tím už se samozřejmě experimentovalo také; ani ne tak ovšem s cílem produkovat kvalitní texty, ale spíše zesměšnit terminologii používanou v některých oborech, demonstrovat nekvalitu recenzního řízení nebo upozornit na to, že na mnohých vědeckých konferencích i v takto označovaných časopisech může být publikován skoro libovolný blábol). Cílem projektu nebylo vyvíjet nové technologie pro práci s jazykem, jak se o to snaží třeba dodavatelé chatbotů, spíše zkusit současné technologie počítačové lingvistiky zavést do produkčního prostředí vědeckého výzkumu a odborných publikací. Vydavatel chce každopádně po bateriích zkusit vytvořit podobné sumarizace i pro témata spadající do jiných oborů, a to včetně společenských věd.


Komentáře

Přidat komentář