Metodología y fe de Erratas de la tabulación de denuncias falsas

De Violencia de Genero

Sobre la recopilación de datos relativos a denuncias falsas en https://denunciasfalsas.com/buscador/listado.jsp.

Metodología hasta 2023–2024

Desde el inicio del proyecto y hasta aproximadamente 2025, la tabulación de datos se realizó de forma completamente manual lo que significaba que no podíamos estar al día.

El proceso consistía en:

  • Localizar noticias en prensa digital, comunicados oficiales y resoluciones judiciales.
  • Analizar cada noticia de manera individual.
  • Extraer manualmente los datos relevantes (fecha, lugar, tipo de resolución, contexto del caso, etc.).
  • Indexar la información a mano en la base de datos del buscador.

Este enfoque permitía un control total sobre los datos, pero no era escalable y dependía del tiempo disponible para la revisión manual.

Metodología en 2025

A partir de 2025 se adopta un proceso asistido por inteligencia artificial para mejorar la eficiencia del sistema.

El flujo de trabajo actual es el siguiente:

  1. Detección manual de noticias potencialmente relevantes.
  2. Extracción automática de información clave mediante IA.
  3. Revisión manual y validación de todos los datos antes de su publicación.

Revisión humana

La inteligencia artificial se utiliza únicamente como herramienta de apoyo. Ningún dato se incorpora al listado sin una revisión manual previa.

La revisión humana es necesaria para:

  • Corregir posibles errores de interpretación.
  • Verificar el contexto legal y judicial.
  • Mantener criterios homogéneos de inclusión.
  • Garantizar la fiabilidad de la información publicada.

Prompts para ChatGPT

Iteración 1 de Diciembre 2025 (3 errores, 1 limitación del prompt)

Prompt 1. Extracción

Para esta noticia

<<url>>

indícame los siguientes datos que puedas extraer

  • Nombre: entre 2 y 4 palabras
  • Día: (YYYY/mm)
  • Causa: CASA_DINERO, HIJOS_CASA_DINERO, VENGANZA, LOCURA, IMPEDIR_COMPARTIDA, HIJOS_ESPECIFICAMENTE, ARREPENTIMIENTO, ?
  • Zona: Pon -1 que está en otra tabla y es complicado que puede ser provincia o CCAA
  • Nº hijos:
  • Media hijos: La edad media de los hijos
  • Ella alega daños personales: NO, ABUSO, LESIONES, VIOLACION, ANTIVACUNAS, AMENAZAS
  • Ella tiene daño físico: ? SI NO
  • Ella alega abusos a hijos: ? NC SI NO
  • Condicionamiento hijos: ? NC SI NO
  • Hombre tiene video: ? NC SI NO
  • Incongruencias ella: ? MUCHAS NINGUNA
  • El sale: SOBRESEIDO CULPABLE NC
  • Orden alejamiento: ? NC SI NO DENEGADA
  • Custodia: NOHAYHIJOS PARAELLA COMPARTIDA ? NC
  • Perseguido de oficio: ? NO SI NC
  • Hombre denuncia de vuelta: ? NO SI NC
  • Mujer admite denuncia falsa: SI ? NO NC
  • Meses pedidos para ella: valor numérico, -1 si desconocido
  • Ella sale: CULPABLE ? NO_INVESTIGADA VISTO_PARA_SENTENCIA
  • Meses condena ella: valor numérico, -1 si desconocido
  • Multa ella: valor numérico, -1 si desconocido
  • Compensatoria contra ella: valor numérico, -1 si desconocido

Revisión manual

Puedes revisar el enlace de ChatGPT más abajo si te interesa

Prompt 2. SQLización

Para los datos que yo te pedí dame un insert sobre esta estructura de tabla respetando el formato de los valores que te dije

<<pegar DDL de la tabla de casos>>

Conclusiones sobre lo que la IA extrae

Fecha Motor Notas Enlace
21/12/2025 ChatGPT 5.2
  • La IA extrae que el hombre no tenia video pero el hombre sí tenía video a través de un policía local que lo grabó.
  • La IA concluye que la motivación era venganza cuando la noticia solo dice "posible concurrencia de motivaciones secundarias" por lo tanto alucina.
  • La IA concluye que ella sufrió abusos pero la noticia claramente dice que solo la hija
  • La IA concluye que fue absuelto pero era una limitación del prompt, debemos contemplar absuelto tras condena (en 2ª instancia)
[1]

Iteración 2 de Diciembre 2025 (3 errores)

Prompt 1. Extracción

Para esta noticia

<<url>>

indícame los siguientes datos que puedas extraer

  • Nombre: entre 2 y 4 palabras
  • Día: (YYYY/mm)
  • Motivación de la mujer para denunciar falsamente: CASA_DINERO, HIJOS_CASA_DINERO, VENGANZA, LOCURA, IMPEDIR_COMPARTIDA, HIJOS_ESPECIFICAMENTE, ARREPENTIMIENTO, ?
  • Zona: Pon 1 (España) que está en otra tabla y es complicado que puede ser provincia o CCAA
  • Nº hijos: -1 para desconocido
  • Media hijos: Si no se sabe si hay hijos -1, en otro caso lLa edad media de los hijos o si no hay NC
  • Ella alega daños personales (del hombre sobre ella): NO, ABUSO, LESIONES, VIOLACION, ANTIVACUNAS, AMENAZAS
  • Ella tiene daño físico: ? SI NO
  • Ella alega abusos a hijos: ? NC SI NO
  • Condicionamiento hijos (por parte de la mujer): ? NC SI NO
  • Hombre tiene video (que demuestre su inocencia, conseguido por él o por terceros): ? SI NO
  • Incongruencias ella: ? MUCHAS NINGUNA
  • El sale: SOBRESEIDO CULPABLE ABSUELTO_EN_2ª_INST NC
  • Orden alejamiento: ? NC SI NO DENEGADA
  • Custodia: NOHAYHIJOS PARAELLA COMPARTIDA ? NC
  • Perseguido de oficio: ? NO SI NC
  • Hombre denuncia de vuelta: ? NO SI NC
  • Mujer admite denuncia falsa: SI ? NO NC
  • Meses pedidos para ella: valor numérico, -1 si desconocido
  • Ella sale: CULPABLE ? NO_INVESTIGADA VISTO_PARA_SENTENCIA
  • Meses condena ella: valor numérico, -1 si desconocido
  • Multa ella: valor numérico, -1 si desconocido
  • Compensatoria contra ella: valor numérico, -1 si desconocido

Revisión manual

Puedes revisar el enlace de ChatGPT más abajo si te interesa

Prompt 2. SQLización

Para los datos que yo te pedí dame un insert sobre esta estructura de tabla respetando el formato de los valores que te dije

<<pegar DDL de la tabla de casos>>

Conclusiones sobre lo que la IA extrae

Fecha Motor Notas Enlace
21/12/2025 ChatGPT 5.2
  • La IA extrae erróneamente que el hecho de que la mujer se autolesione es un signo de locura xD, for the money bro
  • La IA concluye que no hay hijos cuando en la noticia no se dice nada al respecto
  • La IA pone que no corresponde que la fiscalía persiga de oficio... XXXDDD entonces para que está la fiscalia
[2]

Iteración 3 de Diciembre 2025 (1 error, 1 limitación del prompt)

Prompt 1. Carga de ids de ciudad

Primero te voy a cargar un fichero con areas (provincias y CCAA de españa), necesito que recuerdes los IDs pq son claves ajenas de lo que vamos a hacer despues (adjuntar CSV de ciudades)

SELECT id_ciudad,ciudad FROM denuncia.zonas_precio;
Exportar a CSV

Prompt 2. Extracción

Para esta noticia

<<url>>

indícame los siguientes datos que puedas extraer

  • Nombre: entre 2 y 4 palabras
  • Día: (YYYY/mm)
  • Motivación de la mujer para denunciar falsamente: CASA_DINERO, HIJOS_CASA_DINERO, VENGANZA, LOCURA, IMPEDIR_COMPARTIDA, HIJOS_ESPECIFICAMENTE, ARREPENTIMIENTO, ?
  • Zona: Pon 1 (España) que está en otra tabla y es complicado que puede ser provincia o CCAA
  • Nº hijos: -1 para desconocido
  • Media hijos: Si no se sabe si hay hijos -1, en otro caso lLa edad media de los hijos o si no hay NC
  • Ella alega daños personales (del hombre sobre ella): NO, ABUSO, LESIONES, VIOLACION, ANTIVACUNAS, AMENAZAS
  • Ella tiene daño físico: ? SI NO
  • Ella alega abusos a hijos: ? NC SI NO
  • Condicionamiento hijos (por parte de la mujer): ? NC SI NO
  • Hombre tiene video (que demuestre su inocencia, conseguido por él o por terceros): ? SI NO
  • Incongruencias ella: ? MUCHAS NINGUNA
  • El sale: SOBRESEIDO CULPABLE ABSUELTO_EN_2ª_INST NC
  • Orden alejamiento: ? NC SI NO DENEGADA
  • Custodia: NOHAYHIJOS PARAELLA COMPARTIDA ? NC
  • Perseguido de oficio: ? NO SI NC
  • Hombre denuncia de vuelta: ? NO SI NC
  • Mujer admite denuncia falsa: SI ? NO NC
  • Meses pedidos para ella: valor numérico, -1 si desconocido
  • Ella sale: CULPABLE ? NO_INVESTIGADA VISTO_PARA_SENTENCIA
  • Meses condena ella: valor numérico, -1 si desconocido
  • Multa ella: valor numérico, -1 si desconocido
  • Compensatoria contra ella: valor numérico, -1 si desconocido

Revisión manual

Puedes revisar el enlace de ChatGPT más abajo si te interesa

Prompt 3. SQLización

Para los datos que yo te pedí dame un insert sobre esta estructura de tabla respetando el formato de los valores que te dije

<<pegar DDL de la tabla de casos>>

Conclusiones sobre lo que la IA extrae

Fecha Motor Notas Enlace
21/12/2025 ChatGPT 5.2
  • Aunque le cargue el CSV con áreas no es capaz de ponerle el ID automáticamente, mira que es obvio lo que pido
  • En general la noticia pone tanto foco en el abuso judicial y la lucha del hombre contra el sistema que no se puede sacar mucho, deberíamos añadir quizás a la BBDD compensatorias del sistema (no compensatorias impuestas a la mujer)
[3]

Iteración 4 de Diciembre 2025 (5 errores y graves)

Prompt 1. Carga de ids de ciudad

Primero te voy a cargar un fichero con areas (provincias y CCAA de españa), necesito que recuerdes los IDs pq son claves ajenas de lo que vamos a hacer despues (adjuntar CSV de ciudades)

SELECT id_ciudad,ciudad FROM denuncia.zonas_precio;
Exportar a CSV

Prompt 2. Extracción

Para esta noticia

<<url>>

indícame los siguientes datos que puedas extraer

  • Nombre: entre 2 y 4 palabras
  • Día: (YYYY/mm)
  • Motivación de la mujer para denunciar falsamente: CASA_DINERO, HIJOS_CASA_DINERO, VENGANZA, LOCURA, IMPEDIR_COMPARTIDA, HIJOS_ESPECIFICAMENTE, ARREPENTIMIENTO, ?
  • Zona: Usa el ID de la zona (provincia o CCAA) que te he subido antes (mejor provincia que CCAA si se sabe)
  • Nº hijos: -1 para desconocido
  • Media hijos: Si no se sabe si hay hijos -1, en otro caso lLa edad media de los hijos o si no hay NC
  • Ella alega daños personales (del hombre sobre ella): NO, ABUSO, LESIONES, VIOLACION, ANTIVACUNAS, AMENAZAS
  • Ella tiene daño físico: ? SI NO
  • Ella alega abusos a hijos: ? NC SI NO
  • Condicionamiento hijos (por parte de la mujer): ? NC SI NO
  • Hombre tiene video (que demuestre su inocencia, conseguido por él o por terceros): ? SI NO
  • Incongruencias ella: ? MUCHAS NINGUNA
  • El sale: SOBRESEIDO CULPABLE ABSUELTO_EN_2ª_INST NC
  • Orden alejamiento: ? NC SI NO DENEGADA
  • Custodia: NOHAYHIJOS PARAELLA COMPARTIDA ? NC
  • Perseguido de oficio: ? NO SI NC
  • Hombre denuncia de vuelta: ? NO SI NC
  • Mujer admite denuncia falsa: SI ? NO NC
  • Meses pedidos para ella: valor numérico, -1 si desconocido
  • Ella sale: CULPABLE ? NO_INVESTIGADA VISTO_PARA_SENTENCIA
  • Meses condena ella: valor numérico, -1 si desconocido
  • Multa ella: valor numérico, -1 si desconocido
  • Compensatoria contra ella: valor numérico, -1 si desconocido

Revisión manual

Puedes revisar el enlace de ChatGPT más abajo si te interesa

Prompt 3. SQLización

Para los datos que yo te pedí dame un insert sobre esta estructura de tabla respetando el formato de los valores que te dije

<<pegar DDL de la tabla de casos>>

Conclusiones sobre lo que la IA extrae

Fecha Motor Notas Enlace
21/12/2025 ChatGPT 5.2
  • Se inventa que la provincia es Jaén cuando es Gijón (se sigue liando con los IDs del CSV creo)
  • Concluye que la motivación era venganza pero perfectamente podía ser interés económico
  • ChatGPT Falla en casi todo: dice que el sale sobreseido cuando se ha pasado meses en la carcel (???), la fiscalía no persigue de oficio, no hay un psicosocial que demuestre que el hijo estaba harto de la madre...
[4]

Iteración 5 para cuando pueda hacerlo

Lo de la carga de areas en CSV no funciona pero ademas se le escapan cosas super básicas a menudo

Referencias