PornHub nasazuje umělou inteligenci na katalogizaci videí
PornHub asi netřeba představovat bez ohledu na to, zdali jste pravidelný konzument jeho obsahu, nebo jej považujete za největší zlo na internetu. Stránka tu prostě je a má své problémy. Vedle jistě neustávajícího shánění dalších a dalších petabajtů diskového prostoru pro videa - neb lidová tvořivost nezná meze - to je právě roztřídění obsahu pro co nejsnadnější vyhledávání.
Pokud se chci v popisu de facto databázového problému, který PornHub řeší, vyhnout příliš primitivním popisům, tak zjednodušeně řečeno jde o to, že když někdo (běžný Franta uživatel) nahraje nové video na PornHub, typicky si příliš neláme hlavu s vhodnou kategorizací. A přitom typický konzument je rád, pokud může v tom obrovském množství videí provést nějakou selekci (typu: blondýna, prostorově dominantní hrudník, dva doktoráty, plynulá swahilština apod.).
Právě o tuto selekci, resp. doplnění příslušných tagů k jednotlivým videím, se má postarat nová umělá inteligence, skrze kterou PornHub prožene celý svůj katalog. Ta sama zanalyzuje každé jednotlivé video snímek po snímku a přiřadí mu odpovídající tagy, a to nejen co do parametrů, nýbrž též jmen „hereček“ a „herců“ a na videu realizovaných technik.
Doteď systém prošel zhruba půl miliónu videí. PornHub doufá, že se umělé inteligenci (možná jde ale o příliš silné slovo pro nějakou dobře naučenou neuronovou síť) podaří projít celý katalog do začátku roku 2018. Technicky vzato jde o zajímavý problém, nepochybně ne nepodobný tomu, který řešil a stále řeší Google u služby YouTube a jiní u dalších služeb, kde je drtivá většina obsahu nahrávána běžnými lidmi bez dostatečných znalostí pro kvalitní ruční katalogizaci obsahu.