BIRSE - ImageSearch APP
Un nuevo avance
BIRSE se basa en herramientas generativas y establece un modelo de aprendizaje de muestra cero que combina texto e imágenes. Este innovador sistema de búsqueda de imágenes, al igual que los renombrados modelos de lenguaje de visión (LLM), posee capacidades de "comprensión de imágenes". Va más allá de las meras apariencias y colores, permitiéndole identificar imágenes con significado compartido. Esto incluye características como la textura y el estilo de un elemento, resolviendo la complejidad de expresar ciertos atributos en palabras que las búsquedas de imágenes estándar no pueden analizar.
Escenarios de aplicación
En el pasado, utilizar el motor de búsqueda BigGo requería ingresar palabras clave para consultar y comparar productos. Si bien este enfoque se adapta a artículos con especificaciones explícitas, como componentes de computadoras y productos electrónicos, es menos efectivo para moda, muebles u objetos con diversos estilos y materiales que son difíciles de describir textualmente.
Orientación del producto
Otro desafío es que los resultados de búsqueda, especialmente para contenido relacionado con la moda, a menudo conducen a bases de datos de imágenes y fotografías de atuendos de influencers. Encontrar opciones de compra directa en plataformas de compras solía ser limitado o incluso imposible. Antes de la introducción de BIRSE, otros sistemas de búsqueda de imágenes ofrecían una funcionalidad similar, pero su escala y precisión de búsqueda no eran particularmente sobresalientes. Con los importantes modelos de parámetros de BigGo y una base de datos de 500 millones de productos locales, nuestro objetivo es mejorar las capacidades de esta aplicación y ayudar a los usuarios a localizar rápidamente los productos que desean.