No todas las palabras son iguales

Cuando tu hijo necesita verificar que realmente es la abuela quien esta al telefono — y no un clon de voz con IA — la palabra clave tiene que salir al instante. Sin dudar, sin "era carmin o escarlata?", sin trabarse con una palabra que no puede recordar bien. La diferencia entre una palabra que funciona y una que falla se reduce a decadas de investigacion en ciencia cognitiva.

Reconstruimos nuestras listas de palabras desde cero utilizando evidencia de psicolinguistica, investigacion sobre memoria y estudios de seguridad. Esto es lo que dice la ciencia — y como moldeó cada palabra en nuestro generador.

Los dos grupos que mas importan

Las palabras clave necesitan funcionar para todos, pero dos grupos enfrentan los mayores riesgos: los adultos mayores (65+), que son el blanco principal de las estafas de clonacion de voz, y los ninos (de 6 a 12 anos), que necesitan codigos de verificacion para ser recogidos. Estos grupos tienen perfiles cognitivos especificos que requieren propiedades especificas de las palabras.

  • Los adultos mayores experimentan estados de "punta de la lengua" con mas frecuencia — saben la palabra pero no pueden recuperarla. Las palabras aprendidas temprano en la vida resisten estos fallos.
  • Los ninos tienen vocabularios mas reducidos. Una palabra como "cobalto" o "nebula" puede no estar en su diccionario mental.
  • Ambos grupos tienen menor capacidad de memoria de trabajo, lo que hace mas dificil retener y repetir palabras largas o complejas.
  • La verificacion por telefono agrega ruido, presion de tiempo y estres — todo lo cual degrada la recuperacion de palabras dificiles.

Criterio 1: Concretud — Puedes imaginarlo?

El predictor mas poderoso de si alguien recordara una palabra es la concretud — que tan facilmente evoca una imagen mental. "Perro" crea una imagen mental instantanea. "Cuantico" no. Esto se explica con la teoria de codificacion dual (Paivio, 1971): las palabras concretas se almacenan tanto en el sistema de memoria verbal como visual, dandole a tu cerebro dos caminos de recuperacion en lugar de uno.

2x
ventaja en recuperacion — las palabras concretas se recuerdan aproximadamente el doble que las abstractas en experimentos de recuerdo libre

Brysbaert y colegas (2014) calificaron 40,000 palabras en ingles por concretud en una escala de 1 a 5. Priorizamos palabras con puntuacion de 4.0 o superior. Cada animal, alimento y objeto del hogar en nuestras listas crea una imagen mental vivida. Eliminamos terminos abstractos como "cuantico", "espectro", "digital" y "cosmico" — obtienen menos de 3.0 en calificaciones de concretud.

Criterio 2: Edad de adquisicion — Mientras mas temprano, mas fijo

Las palabras aprendidas temprano en la vida se almacenan mas profundamente y resisten los fallos de recuperacion relacionados con la edad. Esto se llama el efecto de edad de adquisicion (EdA), y es uno de los hallazgos mas robustos en psicolinguistica. Kuperman y colegas (2012) recopilaron calificaciones de EdA para 30,000 palabras.

Para los adultos mayores, esto es critico. Cuando las hormonas del estres inundan el cerebro durante una llamada de estafa, las palabras aprendidas temprano sobreviven mientras que las aprendidas tarde se vuelven inaccesibles. Una persona de 78 anos siempre puede recuperar "perro" o "manzana" — pero "mandolina" o "pabellon" podrian escaparse bajo presion.

Priorizamos palabras con una calificacion de edad de adquisicion de 6.0 o menor — lo que significa que tipicamente se aprenden antes de los 6 anos. Esto asegura que tanto ninos como adultos mayores compartan un vocabulario comun profundamente arraigado.

Criterio 3: La ventaja de lo animado

Los seres vivos se recuerdan mejor que los objetos inanimados. En multiples estudios, las palabras animadas (animales, personas) superan consistentemente a las palabras inanimadas en recuerdo libre, incluso cuando se equiparan en frecuencia, concretud e imaginabilidad. Aka, Phan y Kahana (2021) demostraron esta "ventaja de lo animado" en experimentos de memoria a gran escala.

105
palabras de animales en nuestra lista de sustantivos — la categoria mas grande, porque las palabras animadas son las mas memorables

Por eso nuestra lista de sustantivos lidera con animales: perro, gato, caballo, oso, pinguino, delfin, aguila, tortuga. Estos no son solo familiares — activan un sistema profundo de reconocimiento evolutivo. Tu cerebro evoluciono para notar y recordar seres vivos, y esa ventaja persiste incluso bajo estres.

Criterio 4: Seguridad telefonica — Dilo en voz alta

Una palabra clave que se ve bien en papel puede fallar completamente en una llamada telefonica. El estudio clasico de Miller y Nicely (1955) mapeo que consonantes se confunden con ruido: b/d, m/n, p/t, f/s. La investigacion moderna sobre el diseno del alfabeto fonetico OTAN confirma que ciertos patrones de sonido son inherentemente mas claros a traves de canales de audio degradados.

  • Homofonos: "cima" suena como "sima", "vaca" como "baca", "hola" como "ola"
  • Pronunciacion variable: palabras que diferentes regiones pronuncian de manera distinta
  • Dificiles de deletrear al escuchar: palabras de origen extranjero como "croissant", "brioche" y "lychee"
  • Pares minimos: palabras demasiado facilmente confundibles por telefono

Criterio 5: Sin trampas de sinonimos

La investigacion cognitiva sobre errores de recuperacion muestra que las palabras similares interfieren entre si. Si tu palabra clave usa "carmin" pero tu lista tambien contiene "escarlata", "granate" y "rubi", el cerebro puede recuperar el sinonimo equivocado bajo presion. Esto se llama "sustitucion en la recuperacion" — el concepto correcto, la palabra incorrecta.

Deduplicamos sistematicamente los grupos de sinonimos. De cuatro palabras de "rojo oscuro", conservamos una. De tres sinonimos de "valiente", conservamos uno. De cuatro verbos de "correr", conservamos uno. La regla: maximo una palabra por concepto.

Criterio 6: Categorias de nivel basico

La psicologa cognitiva Eleanor Rosch demostro en 1976 que los humanos piensan naturalmente en "categorias de nivel basico". Ves un perro — no un "mamifero" (demasiado abstracto) ni un "golden retriever" (demasiado especifico). Las palabras de nivel basico se reconocen mas rapido, se aprenden mas temprano y se usan con mas frecuencia en todas las culturas.

Reemplazamos palabras especificas de categoria con equivalentes de nivel basico. En lugar de "condor" u "osprey", nuestra lista usa "halcon" y "aguila" — las aves de nivel basico. En lugar de "chirivía" y "lenteja", usamos "zanahoria" y "papa". Las palabras de nivel basico son el camino mas rapido de concepto a palabra.

Por que tamanos de lista en potencias de 2?

Nuestras listas contienen exactamente 256 adjetivos, 512 sustantivos y 128 verbos. Estos no son arbitrarios — son potencias de dos, elegidos por una razon tecnica. Cuando nuestra aplicacion movil deriva palabras de un codigo basado en tiempo (TOTP), extrae bytes de un hash criptografico. Si divides un byte aleatorio por un numero que no es potencia de 2, algunas palabras se vuelven ligeramente mas probables que otras (sesgo de modulo). Los tamanos en potencias de 2 eliminan este sesgo por completo.

11.8 millones
de combinaciones posibles de palabras clave estandar (256 x 512 x 90) — aproximadamente 23.5 bits de entropia

Lo que eliminamos — y por que

  • Grupo de ciencia/espacio (18 palabras): "pulsar", "quasar", "cuantico", "isotopo", "foton" — inaccesibles tanto para ninos como para adultos mayores. Conservamos 9 palabras concretas del espacio como "cohete", "cometa" y "eclipse".
  • Objetos arcaicos (19 palabras): "jarra medieval", "muralla", "cetro", "huso" — objetos medievales que la mayoria de las personas nunca ha visto en la vida real.
  • Alimentos de especialidad extranjera (10 palabras): "focaccia", "brioche", "lychee" — dificiles de deletrear al escuchar, desconocidos para muchos.
  • Animales exoticos (12 palabras): "condor", "gibon", "osprey", "narval" — reemplazados con animales universalmente conocidos como "perro", "gato" y "caballo".
  • Grupos de sinonimos (30+ palabras): reducidos a una palabra por concepto en las tres listas.

Lo que agregamos — Los basicos faltantes

El hallazgo mas sorprendente de nuestra auditoria: las listas de palabras carecian de las palabras mas basicas y universalmente conocidas del idioma. Sin "rojo" ni "azul". Sin "perro" ni "gato". Sin "manzana" ni "banana". Sin "cuchara" ni "silla". Estas son las palabras que todo ser humano conoce, que todo nino aprende primero, y que todo adulto mayor puede recuperar sin esfuerzo — y no estaban en la lista.

  • Colores basicos: rojo, azul, verde, amarillo, naranja, rosa, blanco, negro — los colores que todo nino pequeno conoce
  • Animales comunes: perro, gato, caballo, oso, rana, pato, buho, ballena, mono — universalmente reconocidos
  • Alimentos cotidianos: manzana, banana, pan, queso, pizza, galleta — cosas en toda cocina
  • Objetos del hogar: cuchara, tenedor, reloj, silla, taza, tazon, puerta, llave — objetos que tocas a diario
  • Acciones corporales: correr, caminar, comer, dormir, reir — cosas que toda persona hace

La prueba de validacion de 10 puntos

Cada palabra en nuestras listas paso una lista de verificacion de 10 puntos. Este no es un sistema de puntuacion — es una puerta de aprobado/reprobado. Un solo fallo elimina la palabra.

  • Puede un nino de 7 anos imaginarlo?
  • Un nino de 6 anos conoceria esta palabra?
  • Es una palabra comun de uso cotidiano?
  • Dila en voz alta — hay riesgo de confusion por telefono?
  • Puede alguien deletrearla despues de escucharla una vez?
  • No hay sinonimo ya en la lista?
  • No hay homofono ya en la lista?
  • No es culturalmente exclusiva?
  • Positiva o neutral — no asusta, no es violenta ni negativa?
  • De 1 a 3 silabas, de 3 a 8 caracteres preferido?

La investigacion en la que nos basamos

Nuestra seleccion de palabras se basa en evidencia convergente de multiples campos. Estos no son estudios seleccionados a conveniencia — representan decadas de hallazgos replicados en psicologia cognitiva, investigacion en seguridad y linguistica aplicada.

  • Brysbaert, Warriner y Kuperman (2014) — Calificaciones de concretud para 40,000 palabras en ingles. Publicado en Behavior Research Methods.
  • Kuperman, Stadthagen-Gonzalez y Brysbaert (2012) — Normas de edad de adquisicion para 30,000 palabras en ingles.
  • Aka, Phan y Kahana (2021) — Prediciendo la memorabilidad de palabras con enfasis en la ventaja de lo animado.
  • Rosch (1976) — Categorias de nivel basico: por que "perro" se reconoce mas rapido que "beagle" o "animal".
  • SUBTLEX-US — Normas de frecuencia de palabras derivadas de 51 millones de palabras de subtitulos de peliculas estadounidenses.
  • EFF Diceware (2016) — Criterios mejorados de la Electronic Frontier Foundation para listas de palabras de frases de contrasena seguras.
  • Miller y Nicely (1955) — Patrones de confusion de consonantes en condiciones ruidosas, fundamentales para el diseno de palabras seguras para telefono.
  • Shay et al. (2012, CMU SOUPS) — Memorabilidad de frases de contrasena a traves de la construccion de escenas.
  • NCMEC KidSmartz — Pautas del Centro Nacional para Ninos Desaparecidos y Explotados sobre palabras clave familiares.

Nuestras listas de palabras estan versionadas y congeladas para el sistema de codigos basados en tiempo de la aplicacion movil. Cada palabra clave generada hoy sera verificable anos despues, incluso sin conexion. La ciencia detras de la seleccion de palabras asegura que seguiran siendo memorables a traves de las generaciones.