El contenido no estructurado en forma de texto libre es la materia prima de las comunicaciones entre personas. Está comúnmente aceptado que el 80% de la información relevante para las empresas se origina en forma no estructurada, y que el volumen de ese texto libre crece mucho más que los datos estructurados.
Sin embargo, todo ese texto apenas es analizado y tenido en cuenta en la toma de decisiones empresariales, debido a que su lectura manual tiene un alto costo en tiempo y dinero, y su interpretación automática era, hasta casi poco, inviable.
Afortunadamente, la clasificación semántica entiende el significado de un texto digital, lo que facilita su interpretación automática y su recuperación cuando es relevante. Algunos sectores clave que lo pueden utilizar de forma directa son los siguientes:
Medios de comunicación y editoriales
Etiquetado de noticias, clasificación de contenidos, puesta en valor de la hemeroteca digital, cálculo de noticias relacionadas, organización y explotación del archivo interno. Todas estas ventajas también se trasladan transitivamente a los fabricantes de CMS.
Sector médico y farmacéutico
Análisis de textos libres en el Historial Clínico Electrónico (HCE) de los pacientes. ayudando a explotar información como como el coste de tratamientos médicos, su eficiencia (precio, ventajas y riesgos), referencias a fármacos, efectos secundarios o resultados a largo plazo.
Banca y seguros
Parseo de fuentes de información no estructuradas como el BOE (Boletín Oficial del Estado) o el BORME (Boletín Oficial del Registro Mercantil) para monitorizar riesgos asociados a sus clientes, entender mejor a sus mercados y cumplir con la regulación vigente.