Asesoria & Asesores Fiscales

Tradicionalmente, la tarea de revisión de la documentación, como parte de los procesos de eDiscovery, se ha basado en procedimientos lineales, realizados principalmente por revisores humanos, donde la información es filtrada, revisada y producida de forma manual, aún con la ayuda de herramientas informáticas.

Sin embargo, en los últimos tiempos se han añadido nuevas capacidades de analítica avanzada, como el aprendizajeactivo, que suponen una mejora significativa de la eficiencia del proceso de revisión.



Basado en las técnicas del aprendizaje automático (del inglés machinelearning), el aprendizaje activo implica la selección estratégica de muestras de datos para su posterior revisión manual. Es decir, en lugar de realizar la revisión de todos los documentos de un conjunto de datos, el algoritmo de aprendizaje activo identifica primero aquellos documentos que, basados en su contenido, pudieran ser más relevantes, y los presenta para su revisión manual. A medida que se revisan estos documentos, el alfmagoritmo aprende de los comentarios y decisiones de los revisores humanos, lo que le permite refinar y mejorar la selección de los nuevos documentos que se incluyen en la cola de revisión.

A menudo, los métodos tradicionales como la búsqueda por palabras clave equivalen a dar palos de ciego. Por el contrario, el uso de técnicas de aprendizaje automático permite aprovechar los documentos existentes para entrenar el algoritmo sobre su relevancia. Permitiendo también, seleccionar nuestro propio conjunto de documentos de ejemplo para el aprendizaje, libres de las restricciones de contener o no las palabras clave.

Al seleccionar estratégicamente los documentos para su revisión manual, el proceso de revisión es más rápido y eficiente, lo que permite ahorrar tiempo y recursos.

Este cambio en el modelo de revisión, de un proceso lineal a uno basado en técnicas de aprendizaje automático, ha sido impulsado por la continua necesidad de mejorar la eficiencia y reducir los costes asociados al proceso de revisión.

Aplicaciones del aprendizaje automático en los procesos de eDiscovery

  • Clasificación de documentos: A la postre la tarea más importante en el proceso de eDiscovery, y en la que el aprendizaje automático se utiliza para mejorar la eficiencia de la clasificación y acortar los plazos de la revisión, mediante la identificación de patrones y características comunes en los documentos considerados relevantes para el caso.
  • Identificación de documentos con contenido similar: Encontrar documentos con contenido similar o casi duplicado, es muy común en grandes conjuntos de datos. Sobre todo cuando se trata de correo electrónico o de versiones similares de un mismo documento. En este caso, el aprendizaje automático permite identificar esos documentos, eliminándolos de la revisión.
  • Análisis de sentimientos: Esta técnica se refiere a la identificación de la opinión o el tono de un documento, a partir de su contenido. Pudiéndose analizar automáticamente si un documento tiene un tono positivo, negativo o neutral.
  • Extracción de información: Relacionado con la identificación de información relevante en los documentos, como: fechas, nombres y secuencias numéricas (teléfonos, números de cuentas), reduciendo el riesgo de errores humanos en la extracción manual de esa información.

Ventajas del uso del aprendizaje automático en los procesos de eDiscovery

  • Eficiencia mejorada de la revisión: La automatización de ciertos procesos de revisión de documentos y análisis de datos, acelera el proceso de la revisión y reduce el tiempo dedicado a tareas manuales repetitivas.
  • Precisión mejorada de la revisión: Gracias a la identificación de documentos relevantes y patrones ocultos en grandes conjuntos de datos, que podrían haber sido pasados por alto en una revisión manual.
  • Reducción de costes:

Sigue leyendo en BDO

Categoria

Fiscalidad general