Los investigadores usaron la red neuronal llamada 'CLIP' que compara imágenes, basándose en fotografías subtituladas que están disponibles en Internet.