Kompiuteris gali atpažinti balsą, tačiau skaityti iš lūpų – ši užduotis elektronikai, panašu, bus neįveikiama dar eilė metų. Tuo įsitikinęs Ahmad Hassanat – mokslininkas iš Jordanijos, rašo puslapis „MIT Technology Review“.
Mokslininko teigimu, žmogaus kalbėjo naudojama daugiau nei 50 skirtingų garsų, tuo tarpu jų tarimui lūpos naudoja viso labo 10–14 formų.
Tokiu būdu, skaitymas iš lūpų reikalauja ne tik suderinti formas ir garsus, tačiau kartu stebėti kūno kalbą, reikia žinoti pokalbio kontekstą, kartu labai svarbi intuicija. Neretai kalbančiojo lūpos būna paslėptos, todėl dalis pokalbio pradingsta.
Eksperimentai rodo, kad netgi naudojant ribotą žodžių rinkinį (pavyzdžiui, tariant tik skaičius), kompiuterinis skaitymas iš lūpų sėkmingas tik 50 % atvejų. Atlikdamas nuosavus eksperimentus, kai sąlygos griežtai kontroliuojamos, pasiekiamas 76 % sėkmės rodiklis, o moterų atveju jis netgi didesnis – jos neturi barzdų ir ūsų (išskyrus labai retus „eurovizinius atvejus“), kurie apsunkina lūpų formų atpažinimą.
Vizualinį kalbos atpažinimą apsunkina eilė techninių problemų, kartu gali kilti klausimas dėl konfidencialumo ir asmeninio gyvenimo neliečiamumo. Juo labiau, kad bet kuri gera idėja turi šviesiąją ir tamsiąją realizavimo pusę.