Construyendo su taxonomía (Parte 3) – expert.ai

Esta es la publicación final de nuestra serie de blogs de 3 partes sobre cómo utilizar taxonomías para aprovechar el valor de los datos lingüísticos no estructurados en su organización.

Para la empresa actual, sus datos de lenguaje no estructurados no son simplemente un subproducto de las operaciones, sino un recurso vital que se debe extraer para obtener información procesable. Ya sea que se trate de información interna que sus empleados necesitan para poder trabajar de manera más eficaz y eficiente, o de clientes que confían en usted para obtener el conocimiento contenido en los documentos, informes, transcripciones, archivos PDF o publicaciones en redes sociales que administra, lo que está en juego no podría ser mayor. .

Una taxonomía ayuda a los usuarios a encontrar información en su sitio web, su intranet o cualquier otro repositorio digital. Lo hacen abordando los mismos desafíos que hacen que el descubrimiento de información sea tan difícil en primer lugar.

Taxonomías:

  • Maneje la ambigüedad en el lenguaje para que todos los conceptos y la terminología en su contenido se entiendan en el contexto adecuado.
  • Le permite designar el significado de todos los términos, acrónimos y conceptos que son importantes para su negocio y asegurarse de que su contenido esté etiquetado en consecuencia.
  • Transforme el contenido de su empresa en inteligencia procesable al vincular datos a través de repositorios y silos de información.

Entonces, ¿cómo puede aprovechar las taxonomías en su organización?

Opciones de taxonomía: ¿Crear, pedir prestado o ambos?

La buena noticia es que tiene opciones según las preferencias de la organización y la tecnología que puede aprovechar.

Un gran punto de partida es considerar las siguientes preguntas:

  • ¿Existen taxonomías estándar para su industria o para la que se dirige?
  • ¿Tiene alguna información o conocimiento interno (también conocido como folcsonomías) que pueda aprovechar?

Por suerte, no tienes que empezar de cero.

Hay muchas taxonomías específicas de la industria disponibles (MeSH para temas médicos, IPTC para temas de medios son solo dos ejemplos) que puede usar tal cual o como punto de partida para reducir el tiempo dedicado a desarrollar y personalizar su propia taxonomía. La base de datos de TaxoBank y WAND Inc. son excelentes recursos para encontrar estas taxonomías fundamentales específicas de la industria.

Sin embargo, si trabaja en un dominio muy especializado o se encuentra en algún lugar entre los estándares disponibles, deberá considerar la creación de su propio esquema de organización de contenido. Como es de esperar, esta puede ser una tarea laboriosa que requeriría una gran inversión de tiempo y experiencia en la materia para etiquetar correctamente el contenido. Pero de nuevo, no tienes que empezar desde cero.

La tecnología existe para ayudarlo a impulsar la creación de una taxonomía. Expert.ai ofrece una función lista para usar, llamada Taxonomía Mágicaque clasificará automáticamente cualquier tipo de documento, como libros blancos, noticias y boletines, libros, marcos, artículos, reseñas de manuales, etc. Esto garantiza que su contenido cumpla con los criterios que establecimos anteriormente: correctamente entendido, coherente y correctamente etiquetado, conectado a través de todos sus repositorios, mientras evita el tiempo y el gasto de crear manualmente una taxonomía desde cero.

Nuestro modelos de conocimiento contienen conceptos y relaciones que son específicos para diferentes industrias, dominios, roles y casos de uso que se pueden usar de manera inmediata y personalizar aún más para satisfacer las necesidades específicas de su proyecto. Nuestra biblioteca incluye modelos de conocimiento para los dominios de los medios, las ciencias de la vida y la salud y las finanzas, así como para ESG, sentimiento e información de identificación personal (PII).

Consideraciones de diseño de taxonomía

Ya sea que tome prestada o cree su taxonomía, hay varias consideraciones que deberá administrar para asegurarse de tener éxito. Aquí hay una lista de verificación rápida:

  • Asegúrese de que su taxonomía refleje su conocimiento del dominio. Su taxonomía es una oportunidad para organizar su información (sus documentos, conocimientos y todos sus activos de datos) de una manera que respalde la forma en que sus usuarios navegarían por su contenido.
  • Comprenda a sus usuarios objetivo. ¿Tu audiencia es el público en general o es una audiencia profesional? Una vez más, es importante asegurarse de que los usuarios entiendan el contenido o la información que entrega y que clasifique y entregue su información para que pueda navegarse de la manera en que la entienden los expertos del dominio.
  • Prepárese para el éxito en el etiquetado de contenido. Esta es una parte crítica del proceso que es mejor realizada por aquellos con la experiencia más profunda en la materia de su organización. Sin embargo, el etiquetado de contenido lleva tiempo y es probable que estos mismos recursos ya estén involucrados en otro trabajo de mayor valor. La tecnología de inteligencia artificial especializada en la comprensión del lenguaje puede proporcionar el etiquetado de alta precisión que necesita, y se pueden incorporar expertos en la materia en varias etapas para ayudar a verificar la precisión.
  • Enriquece tu contenido. Luego, le recomendamos que vincule su taxonomía establecida a TODO su contenido de destino, a menudo denominado enriquecimiento de contenido. Esto optimizará sus resultados. Obviamente, su taxonomía debe ser representativa del contenido al que se dirige. Está diseñado para cubrir la variedad de temas que aborda un conjunto de datos. Esto requiere anotación y pruebas para mejorar los resultados de precisión de la clasificación. Tu taxonomía es un organismo vivo que se alimenta de tu contenido. En última instancia, no puede crear y probar la taxonomía sin un conjunto de datos representativo.
  • Mantenga a sus usuarios informados. Los usuarios deben participar para mejorar la relevancia del diseño de la solución para el acceso y descubrimiento de la información. Aquí es donde realmente puede influir en la adopción de los usuarios y ver el impacto en la solución final que crea.

Impulsar el descubrimiento exitoso de datos: recomendaciones

A modo de resumen y revisión, aquí hay algunas recomendaciones para guiarlo en su viaje:

  1. Comience con el objetivo que impulsa su iniciativa de descubrimiento. Comprender los obstáculos a los que se enfrenta. Pregúntese: ¿tiene archivos sin explorar, es difícil navegar por su contenido o su búsqueda es ineficiente? Califica los obstáculos.
  2. Recuerda tus opciones. No tienes que empezar con una pizarra en blanco. Puede confiar en taxonomías o modelos de conocimiento existentes, o puede aprovechar las herramientas de IA para crear una nueva taxonomía. Incluso puede reutilizar y reciclar taxonomías. Aquí es donde la tecnología realmente puede ayudar.
  3. Asegúrese de que su taxonomía cubra correctamente los dominios representados por su contenido. No podemos enfatizar esto lo suficiente. El contenido que utilizará para crear su taxonomía debe provenir de múltiples conjuntos de datos representativos que reflejen su negocio; no deje nada fuera.
  4. Piensa en tu taxonomía como si fuera un organismo vivo. A medida que su negocio, clientes y mercados evolucionan, es importante asegurarse de que su taxonomía evolucione con ellos. Ocasionalmente querrá medir la eficacia con la que está resolviendo su problema comercial con su taxonomía. ¿Está impulsando una mayor participación de sus usuarios? ¿Tu equipo es más eficiente? ¿Tu búsqueda es más precisa? ¿Están sus archivos completamente representados en su taxonomía? ¿Qué pasa con sus iniciativas más recientes? Estas métricas le ayudarán a asegurarse de que está en el camino correcto.

¡Esperamos que esta serie de blogs ayude en el viaje de su organización hacia el descubrimiento de datos! Comience desde el principio: Parte 1: El desafío del descubrimiento de datos y Parte 2: Cómo las taxonomías resuelven sus problemas de descubrimiento de datos.

Para obtener más información, no dude en comunicarse con nosotros aquí.

Fuente del artículo

Deja un comentario