Este artículo pertenece a Gen AI Series “From ZERO to HERO: IA Generativa aplicada”, una serie de artículos y novedades sobre IA Generativa aplicada a la industria que te ayudarán a conocer mejor esta tecnología y aplicarla de manera efectiva.
Accede al universo de la IA Generativa
Como ya hemos visto en el artículo “Casos de uso de IA Generativa”, esta tecnología ya se está aplicando en diferentes sectores y áreas de negocio aportando en algunas ocasiones una verdadera ventaja competitiva. En el sector asegurador, los casos de uso de IA Generativa identificados para ser implantados se enfocan en áreas como la gestión documental, la atención al cliente o marketing/ventas. En el área de gestión documental, los grandes modelos de lenguaje (LLMs) son capaces de realizar resúmenes de documentos, informes financieros automáticos estandarizados a partir de datos no estructurados, validación o comparación de documentación, etc.
En este artículo vamos a tratar un caso concreto de uso: El procesamiento automático de información de pólizas con IA Generativa. En este caso, un LLM puede resultar muy útil para identificar y comparar las coberturas de las pólizas de documentos provenientes de distintas compañías, con formatos y estructuras dispares, diferentes maneras de expresar lo mismo, y distintos idiomas. Veamos el caso propuesto más detenidamente y los resultados que se podrían obtener.
Extracción y comparación de información sin IA Generativa
Normalmente las compañías que necesitan comparar documentos de pólizas provenientes de diferentes aseguradoras, como las compañías de mediación, cuentan con un proceso de extracción automática de información.
En estos casos se utilizan reglas para determinar si el documento es nativo o está en formato imagen. Si está en formato imagen, a través de OCR se identifica y extrae la información relevante del documento, y finalmente se extrae la información de la póliza en formato estructurado (coberturas, riesgos, garantías, costes, etc.) a través de expresiones regulares o plantillas en vez de utilizar IA.
Sin embargo, este proceso tiene bastantes limitaciones.
- Está altamente condicionado a documentos con formatos ya esperados (coberturas y garantías siempre en formato tabla, etc.).
- Cada vez que hay un nuevo formato de documento es necesario realizar adaptaciones.
- No es escalable de manera sencilla, ya que las diferentes compañías cuentan con: distintos formatos de documentos, maneras propias de expresar lo mismo, diferentes idiomas, e incluso distintos formatos de documento dependiendo del tipo de póliza (aun dentro de la misma compañía).
Otras compañías sí que han dado el paso y aplican Inteligencia Artificial en este proceso. En este caso para extraer los campos de los documentos se utilizan modelos de Deep Learning como por ejemplo Named Entity Recongition mediante Transformers. El problema es que los enfoques tradicionales de Machine Learning requieren un gran histórico de datos para poder realizar esta extracción de campos con la precisión deseada.
Es aquí donde entra en juego la IA Generativa, ya que este tipo de modelos no necesitan de un gran histórico de datos para conseguir resultados eficientes. Veamos cómo funcionaría a continuación.
Aplicación de IA Generativa
¿Cómo se puede aplicar IA Generativa para mejorar este proceso y abordar las limitaciones comentadas anteriormente? Nuestra propuesta pasa por implementar IA Generativa, de manera que el proceso pasaría a ser:
- Si el documento viene en formato imagen, se usa OCR para la extracción de la información del documento completo.
- Sobre el texto bruto se aplica el modelo de LLM para buscar información relevante en el texto y extraerlo en formato estructurado sin contar con un gran histórico de datos (independientemente del formato de origen). La IA Generativa limpia y corrige errores del OCR de manera automática, es capaz de identificar coberturas y garantías iguales expresadas de diferente manera, encuentra la información independientemente del formato del documento de entrada, permite múltiples idiomas, y devuelve la información necesaria de manera estructurada. Además, aporta una mayor flexibilidad en caso de querer añadir nuevos campos o combinarlos.
Impacto de la solución
Tras realizar múltiples pruebas con diferentes documentos PDF utilizando la IA Generativa, se han obtenido resultados prometedores. Esta combinación es capaz de extraer la información de documentos en cualquier formato y devolver la información de manera estructurada. Logrando mejoras notables frente al modelo anterior:
- Mejora de hasta el 100% en la capacidad de identificar gran parte de las coberturas con las que el sistema actual tiene dificultades.
- Mejora en la extracción de información de nuevos documentos en formatos no conocidos.
- Mayor flexibilidad de cara a añadir nuevos campos o combinar campos existentes.
- Mejora en documentos multi-idioma, siendo capaz de recibir el documento en un idioma y generar la salida en castellano.
- Mejora en la identificación de sinónimos o diferentes maneras de expresar lo mismo (documentos provenientes de diferentes compañías aseguradoras).
- Sin necesidad de contar con una gran cantidad de datos históricos.
Sin duda la aplicación de IA Generativa puede ayudar enormemente en el procesamiento automático de información, sobre todo si la obtenemos de diferentes fuentes con formatos y estructuras distintas. Esperamos que este caso de uso te haya resultado interesante. Podrás ir viendo otros casos de uso y de éxito en próximos artículos de Gen AI Series “From ZERO to HERO: IA Generativa aplicada”.