Nuestro flujo de decisión para refinar Historias de Usuario poco antes de empezar a desarrollarla

Publicado por Fran Reyes & Manuel Rivero el 08/10/2025

Introducción.

En un post anterior exploramos el tamaño y el nivel de detalle adecuados que debe tener una historia de usuario, e identificamos dos momentos clave en los que conviene refinarlas, que a continuación mostramos en orden cronológico:

T_r, que ocurre poco antes de presentar una historia al equipo.
T_c, que ocurre poco antes del momento de empezar a desarrollar una historia, T_d.

En este post describimos el flujo de decisión que seguimos para facilitar el refinamiento de historias de usuario en el momento T_c.

Nuestro flujo de decisión para refinar historias de usuario poco antes de empezar a desarrollarlas.

T_c es un momento clave en el que podríamos plantearnos ciertas preguntas que nos permitirán refinar nuestras historias de usuario lo suficiente como para que podamos desarrollarlas de forma fluida. Estas preguntas^[1] se basan en los criterios INVEST ^[2] que nos ayudan a evaluar lo adecuada que es una historia de usuario.

En el siguiente diagrama mostramos el flujo de decisión que seguimos en T_c para cada una de las historias de usuario.

**Flujo de decisión para refinar historias poco antes de comenzar su desarrollo**

Para cada una de las historias que pensamos refinar, lo primero es preguntarnos si la historia cumple con los criterios INVEST.

Si la historia cumple todos los criterios INVEST, entonces quiere decir que está lista para ser desarrollada y podemos pasar a la siguiente.

En caso de no cumplir alguno de los criterios, tendremos que preguntarnos si el incumplimiento supone realmente un problema en nuestro contexto^[3].

En caso que el incumplimiento sí que sea un problema, hay que preguntarse si el problema es que la historia de usuario ha dejado de tener valor.

En caso de que ya no tenga valor, deberíamos descartarla y pasar a la siguiente. Eliminar historias sin valor del backlog es muy importante para no generar waste ^[4].

En caso de que la historia siga siendo valiosa debemos refinarla. La forma de refinarla dependerá del criterio INVEST que incumple.

Una vez refinada la historia de usuario, tendremos que volver a evaluarla para verificar si ahora sí que cumple con INVEST.

Cómo evaluar cada criterio y refinarlo si se incumple.

Para facilitar la evaluación de los criterios INVEST, hemos relacionado cada uno de ellos con preguntas clave que nos pueden ayudar a razonar si los estamos incumpliendo. Además, hemos añadido el refinamiento específico que puede corregir el incumplimiento de cada uno de los criterios.

**Preguntas clave y refinamientos por criterio**

¿Por qué nos resultan útiles estas preguntas clave y estos refinamientos para cada criterio INVEST en T_c?

Analicemos cada uno de los criterios por separado para entender mejor los motivos:

1. Independent (I).

Antes de empezar a desarrollar nos interesa que las historias de usuario sean independientes. Que una historia de usuario sea independiente de otras quiere decir que representa un aspecto funcional disjunto del sistema, y esto facilitará que se puedan comprender, implementar y probar de manera aislada. De modo que lograr que una historia sea independiente tiene un impacto directo en el desarrollo de su funcionalidad.

Consideraremos dos tipos de dependencia^[5]:

Solape.
Orden.

Esto significa que debemos hacernos las siguientes preguntas al evaluar el criterio de independencia:

¿Existe solape entre las historias de usuario?
¿Debemos hacer las historias en un orden determinado?

Dependencia por Solape.

Es la que suele ser más problemática ya que genera confusión y puede dar lugar a los siguientes problemas:

Que nos olvidemos de desarrollar alguna funcionalidad.
Que desarrollemos alguna funcionalidad más de una vez.
Que no podamos desarrollarlas en paralelo, lo que afectará a cómo se puede organizar el equipo.

El solape se puede eliminar reescribiendo las historias.

Pongamos un ejemplo de historias de usuario solapadas y veamos cómo se podría resolver.

Imaginemos que tenemos las siguientes historias.

Mostrar los trabajadores de la empresa y mostrar las ofertas laborales de la empresa.

Mostrar los trabajadores de la empresa y poder enviar un mensaje a la empresa.

Ambas historias incluyen la funcionalidad de “Mostrar los trabajadores de la empresa”. Tal como están escritas estas historias se podrían hacer en cualquier orden por lo que estamos ante un problema puramente de solape.

Una manera sencilla de resolverlo, sería separar la funcionalidad que es común^[6], quedando de la siguiente manera:

Mostrar los trabajadores de la empresa.

Mostrar las ofertas laborales de la empresa.

Enviar un mensaje a la empresa.

Dependencia de Orden.

Si tenemos dos historias de usuario A y B, y el desarrollo de B no puede empezar hasta que no hayamos desarrollado A, existe una dependencia de orden de desarrollo entre las historias A y B que denotaremos como A -> B.

Podríamos liberar esta restricción del orden de desarrollo simulando la funcionalidad de A. Simular la funcionalidad de A consistiría en crear la versión más simple posible de A que permita desarrollar B.

Veámoslo mejor con un ejemplo.

Si tenemos las siguientes historias:

Crear un factura.

Marcar la factura como pagada.

Necesitamos desarrollar “Crear una factura” antes que “Marcar la factura como pagada” porque debe existir una factura que se pueda marcar como pagada. Esto significa que existe una dependencia de orden entre ellas: “Crear factura” -> “Marcar factura como pagada”.

En este caso podríamos simular “Crear factura”, por ejemplo, hardcodeando los datos de una factura. Esto permitiría desarrollar “Marcar factura como pagada” antes que “Crear factura”.

Es importante darse cuenta de que no podríamos usar en producción “Marcar factura como pagada” hasta no haber desarrollado “Crear factura”.

Así que no se puede eliminar la dependencia de orden de la funcionalidad, pero sí que podemos eliminar la dependencia de orden del desarrollo.

Poder desarrollar las historias en cualquier orden puede ser beneficioso, porque nos permite priorizar, ya sea por valor o riesgo, la exploración de determinadas funcionalidades, y así maximizar nuestro aprendizaje:

Priorizar aquellas funcionalidades con más valor para los clientes para buscar feedback más temprano y validarlas.
Abordar cuanto antes los posibles riesgos.

Aunque no siempre es posible solucionar la dependencia de orden, esta suele generar menos problemas que la dependencia por solape ^[7].

2. Negotiable (N).

Las partes implicadas en crear un producto deberían colaborar para acordar qué funcionalidad es necesario desarrollar. Para que esta colaboración sea efectiva, debemos mantener nuestras opciones abiertas^[8].

Para evitar reducir nuestras opciones debemos evaluar si la historia está sobrespecificando la solución. Es decir, si está más centrada en el “cómo hay que hacerlo” que en el “qué hay que hacer”.

Fíjense que estamos eligiendo centrar la evaluación de la capacidad de negociar solo en el “cómo” y dejar fuera de la discusión el “qué”. Hemos decidido hacerlo así por pragmatismo^[9].

Si la historia estuviese sobrespecificada tendríamos que valorar y discutir alternativas para ampliar el horizonte de soluciones. Con esto quizás encontremos alternativas más baratas, eficientes y/o que no especifiquen detalles de implementación.

3. Valuable (V).

Todo incremento de funcionalidad debe aportar valor y, por tanto, siempre debemos cuestionar si una historia de usuario lo tiene^[10]. Además, debemos hacer este cuestionamiento de forma continua para entregar en todo momento el máximo valor posible.

Algunos motivos por lo que una historia podría perder valor son:

Se han dado argumentos que cuestionan su valor en alguna conversación.
El contexto ha cambiado (problema o prioridades).

Hay que tener en cuenta que el valor es relativo, siempre estamos comparando unas historias con otras. Esto significa que lo que solemos observar es que una historia pierde valor con respecto a otras.

Sin embargo, al disponer de recursos limitados, debemos priorizar las historias según su valor, y seleccionar algunas de las más valiosas para desarrollar a continuación.

Debemos hacernos dos preguntas con respecto al valor:

¿Tiene valor?
¿Todos perciben claramente el mismo valor?

Si no conseguimos verle valor a una historia, lo mejor es descartarla^[11].

Que no todos perciban el mismo valor podría deberse a un problema de comunicación. En ese caso, tendríamos que explicar mejor la historia para aclarar su valor.

4. Estimable (E).

Para poder estimar una historia primero tenemos que ser capaces de entenderla.

Lo verdaderamente útil de estimar una historia es identificar y examinar la incertidumbre que encierra, no asignarle una cifra al esfuerzo (tiempo) necesario para desarrollarla.

Eliminar la incertidumbre nos ayudará a desarrollar una historia de forma más fluida, y al mismo tiempo, esto hará que su estimación será más precisa.

El origen de la incertidumbre puede venir del espacio del problema o del espacio de la solución. Por ejemplo, la incertidumbre causada por el desconocimiento del dominio vendría del espacio del problema, mientras que la incertidumbre causada por tener poca experiencia en alguna tecnología que necesitamos usar vendría del espacio de la solución.

Distintos miembros del equipo pueden percibir la incertidumbre de una historia de usuario de forma diferente. Esto hace que sea muy importante fomentar que todos los miembros del equipo participen en la discusión sobre la incertidumbre de la historia de usuario (su estimación).

Así que podríamos hacernos la siguiente secuencia de preguntas:

¿Hay incertidumbre en el espacio del problema?.
¿Hay incertidumbre en el espacio de la solución?.

El orden en que nos hacemos estas preguntas es importante, ya que definir mejor el problema podría aclarar la solución.

En caso de haya incertidumbre en el espacio de la solución debido a un desconocimiento de alguna tecnología podríamos reducirla o incluso eliminarla mediante una spike.

En otros casos “añadir más detalles” podría ser una buena forma de reducir la incertidumbre (en un próximo post profundizaremos en qué significa “añadir más detalles”).

5. Small (S).

En el momento T_c nos interesa que las historias sean lo más pequeñas posibles^[12] para poder:

Entregar valor lo antes posible.
Reducir riesgos.
Conseguir ciclos de feedback cortos que nos permitan ajustar prioridades y tomar mejores decisiones.

Debemos plantearnos si existe alguna partición de la historia de usuario que pueda ayudarnos a mejorar alguno de esos aspectos.

Nuestra recomendación es usar de forma sistemática catálogos de heurísticas de partición de historias que nos permitan explorar todas las opciones de partición existentes^[13]. Pensamos que esta recomendación puede ser valiosa tanto para equipos con poca experiencia en partir historias a los que les servirá de guía, como para equipos con experiencia que pueden usarlo para no depender exclusivamente de su memoria.

6. Testable (T).

Que una historia sea testeable nos sirve tanto para evitar malentendidos y suposiciones erróneas, como para saber cuándo está acabada y funcionando cómo se esperaba^[14].

Una historia se considera testeable si dados unos inputs determinados, podemos ponernos de acuerdo sobre el comportamiento esperado del sistema y/o sus efectos observables.

Para ello debemos eliminar cualquier ambigüedad que pueda contener la historia.

Creemos que añadir criterios de aceptación^[15] y ejemplos a una historia de usuario es la manera más efectiva de eliminar su ambigüedad. Así que tiene sentido preguntarnos:

¿Tiene criterios de aceptación suficientes?
En caso que sí, ¿son claros y contienen ejemplos?

Tanto si faltan criterios de aceptación, hay criterios que no son claros o les faltan ejemplos, debemos detallar más la historia para ayudar a aclarar lo que se necesita.

En un próximo post profundizaremos en qué significa detallar más una historia.

Resumen.

En este post hemos descrito y analizado el flujo de decisión basado en los criterios INVEST que seguimos para facilitar el refinamiento de historias de usuario antes de comenzar su desarrollo.

Este flujo usa una serie de preguntas clave para evaluar si una historia incumple alguno de los criterios INVEST, y en caso de incumplimiento nos indica los refinamientos adecuados para mejorarla.

Refinar una historia puede ayudarnos a entregar su valor lo antes posible, reducir riesgos, reducir retrabajo y tener ciclos de feedback más cortos.

Esperamos que este flujo de decisión, o los conceptos de los que les hemos hablado en este post, les puedan resultar útiles.

Agradecimientos.

Quisieramos agradecer a Toño de la Torre y a Alfredo Casado por revisar y darnos feedback sobre el contenido de este post.

Finalmente, también quisieramos agradecer a cottonbro studio por su foto.

Notas.

[1] Las preguntas que nos planteamos en el flujo de decisión que presentamos están pensadas para ayudarnos a conseguir historias listas para ser desarrolladas. Nuestra intención no es buscar la perfección. Al aplicarlo debemos evitar caer en parálisis por análisis. Con este flujo solamente intentamos reducir problemas que la falta de refinamiento puede ocasionar durante el desarrollo, como, por ejemplo, dudas o malentendidos evitables que causan retrabajo y/o retrasan la entrega, aportar poco valor, etc.

[2] Los criterios INVEST nos han dado muy buenos resultados para refinar las historias de usuario y además están muy bien documentados. Si en el futuro encontramos otro conjunto de criterios que nos sean más útiles para el refinamiento de historias, los adoptaríamos. Es decir, nos centramos en INVEST porque es lo que hasta ahora nos ha sido más útil.

[3] La evaluación de estos criterios no ha de aplicarse de manera estricta como si fueran un conjunto de reglas a seguir. Es mejor verlos más bien como una guía.

[4] Si acumulamos historias de usuario sin valor en vez de descartarlas, invertiremos más energía de la necesaria en gestionar el backlog. En un caso extremo podríamos acabar en el antipatrón “Story card hell”, descrito por James Shore como “[…] when you have 300 story cards and you have to keep track of them all” en su post Beyond Story Cards: Agile Requirements Collaboration.

Nos gustaría hacer notar que en un post anterior explicamos cómo se podría llegar a este antipatrón por un motivo diferente: hacer todas las historias demasiados pequeñas en un momento alejado de T_r.

[5] William Wake nos habla de otro tipo de dependencia, containment dependency que ocurre cuando existe una organización jerárquica de varias historias de usuario. En nuestra experiencia las dependencias por solape y orden son más frecuentes así que preferimos ignorar la dependencia por containment en aras de la simplicidad.

[6] En algunas ocasiones, al intentar solucionar una dependencia por solape aparecerá una dependencia de orden.

[7] Algunos motivos por los que creemos que la dependencia de orden genera menos problemas que la dependencia por solape, son:

Cuando la propia naturaleza del problema lleva implícita un orden.
Cuando los participantes han asumido un orden, a veces debido a que han tenido experiencias en contextos similares.

Por ejemplo, las siguientes historias:

Envíar un mensaje.

Reenvíar un mensaje.

Tienen una dependencia de orden, pero por la naturaleza del problema es altamente probable que primero hagamos “Envíar un mensaje” antes que “Reenvíar un mensaje”. Los problemas ocurren cuando no es claro qué orden establecer.

[8] Martin Fowler habla del concepto de Decreed Stories para aquellas historias en las que no hay conversación. En contraposición está el concepto de Conversational Stories en la que la conversación es el núcleo de las historias y que recoge el criterio de Negotiable de INVEST.

[9] Tener capacidad de negociar “qué hay que hacer” puede tener un gran impacto en el trabajo con historias de usuario.

Sin embargo, conseguir poder negociar el “qué” puede implicar modificar el modelo de colaboración existente en un equipo, o incluso, una organización entera. Cambiar las dinámicas de una organización es un problema muy complejo que se sale del ámbito de la discusión del flujo de decisión para refinar historias que estamos presentando.

Por eso, preferimos centrarnos tan solo en “el cómo” (la sobrespecificación), al ser en nuestra experiencia, más accionable a la escala de una historia de usuario.

[10] En este post ampliamos el concepto de valor, normalmente acotado a la funcionalidad, para que también incluya aquellos trabajos de cuidado destinados a mantener la sostenibilidad del sistema.

En este otro post hablamos sobre la importancia de los atributos de calidad, a menudo denominados requisitos no funcionales (aunque esta etiqueta puede ser engañosa) y su relación con las historias de usuario.

[11] No ver valor en una historia de usuario podría estar causado porque falta la perspectiva de alguna parte interesada (stakeholder). Si fuera así, no deberíamos descartar la historia, sino tener una nueva conversación sobre ella en la que incluyamos a dicha parte interesada.

[12] El criterio de Small ha generado bastante confusión.

Bill Wake ahora prefiere usar el concepto Scalable, “I now use another S […]: Scalable”, porque cree que captura mejor la idea de que una historia debe cambiar en tamaño o escala para adecuarse al momento en el que se encuentre.

Para profundizar más lean su post Small – Scalable – Stories in the INVEST Model. Nuestro post ¿Tamaño y nivel de detalle adecuados para una historia de usuario? también habla de este aspecto.

En el post actual usamos Small en vez de Scalable porque estamos analizando el refinamiento que se da poco antes de empezar a desarrollar la historia, y ahí no cabe confusión posible: la historia de usuario debe de ser lo más pequeña posible.

[13] Hay varias heurísticas interesantes que nos pueden indicar posibles particiones. En este artículo hablamos sobre SPIDR, que puede ser un buen punto de partida. En el curso de Historias de Usuario nos basamos en el trabajo de Bill Wake.

[14] La confirmación es uno de los aspectos esenciales enunciados por Ron Jeffries en su post de 2001, Card, Conversation, Confirmation.

[15] Algunos autores usan otros términos para hablar de los criterios de aceptación. Por ejemplo, Mike Cohn prefiere hablar de conditions of satisfaction, mientras que en Example Mapping se utiliza el concepto de rules.

Volver a posts