curso-tdd

Curso de desarrollo para asegurar la calidad del software

Project maintained by JJ Hosted on GitHub Pages — Theme by mattgraham

Flujos y organización del trabajo con Git y GitHub

Planteamiento

Git es una herramienta para gestionar flujos de trabajo y equipos, y en combinación con GitHub/GitLab es imprescindible para gestionar los procesos de calidad del software que vamos a ver en este curso.

Al final de esta sesión

Los estudiantes conocerán las órdenes esenciales de git, y como usar la herramienta de línea de órdenes de GitHub para realizar algunas tareas fundamentales; también sabrán cómo organizar flujos de desarrollo usando pull requests y el concepto del mismo.

Criterio de aceptación

Se habrán formado equipos, y cada equipo habrá creado una descripción del mismo, con sus componentes en un README.md, todos los usuarios añadidos al repositorio, y tendrán que haber añadido sus nombre con un PR (que habrá aprobado algún otro miembro del equipo).

GitHub y git

Comencemos con la creación del repositorio. Primero, haz las siguientes tareas para configurar correctamente git y GitHub.

Configura el usuario, correo electrónico y editor de alguna de las formas posibles.
Crea un par clave pública/privada y súbela a tu perfil en GitHub.

A partir de ahí, vamos a empezar a trabajar con un repositorio directamente. Lo más rápido es crear repositorios directamente en GitHub

A partir de ahora, cuando diga GitHub se entenderá el sitio web que uses para alojar tus repositorios, GitHub, GitLab, BitBucket o el que corresponda; en algunos casos las características podrán no estar disponibles.

Hay tres formas de crearlos: directamente (opción New repository) desde el menú, haciendo un fork o copia de un repositorio existente (lo que se aconseja, principalmente, si vas a trabajar con ese repositorio) o bien creándolos a partir de una plantilla o template. Esto sólo se puede hacer con repositorios que han sido marcados para ello, como el repositorio de este curso; si lo permite, la opción Use this template te permitirá crear tu propio repositorio usando los ficheros existentes. Esta opción tiene la ventaja de que el repositorio no aparece como un fork, y además tienes una serie de ficheros para comenzar rápidamente.

Aconsejamos también que se instale hub, la línea de órdenes de GitHub. Con ella se puede acceder directamente, desde git, a funcionalidades del propio GitHub; por ejemplo, descargar repos sólo con el nombre, o acceder a issues.

Una vez creado el repositorio, se descarga con

git clone mirepo # Si tienes hub instalado
git clone git@github.com:minick/mirepo

El ciclo básico de git consiste en usar add, push, pull y commit. No vamos a entrar demasiado en eso, pero deberías saber cómo usarlos. Sí vamos a ver flujos de trabajo basados en pull requests y dedicar un poco de espacio al formato de los mensajes de commit.

Los mensajes de commit son predicados (el sujeto es el cambio al que se ha sometido), deben ser atómicos, referirse siempre a un issue (y en GitHub puedes indicar qué issue simplemente con # + número del mismo) y usar 50 caracteres si es una sola línea, o 50 + línea en blanco + líneas de 80 caracteres si se trata de más líneas.

Pero adicionalmente, puedes usar una estructura convencional para que sean más informativos y permitan, de un vistazo, saber qué es lo que hacen y a qué se refieren. También puedes usar gitmojis, símbolos que se introducen en un commit entre dos puntos; por ejemplo, :+1: sería el símbolo del pulgar hacia arriba o :see_no_evil: el que se usa cuando se añade algo al fichero .gitignore. Pero se pueden usar muchos otros gitmojis, y os animo a que lo hagáis, porque permiten, de un vistazo, saber de qué va el commit.

El fichero `.gitignore` y su importancia

Ya que mencionamos el fichero .gitignore, más allá de ser algo que evita la molestia de que aparezcan en el status cosas que en realidad no nos interesan, es verdaderamente parte integral de la seguridad de una aplicación. Para empezar, hay que tener en cuenta que afecta a el directorio en el que se encuentra y todos los que hay por debajo; por eso es habitual tener un .gitignore en el directorio raíz. Pero también se pueden crear en subdirectorios específicos si esos subdirectorios usan un lenguaje diferente o simplemente hay ficheros en ellos que no nos interesa que estén.

De forma general, en .gitignore estarán todos los ficheros generados, pero también conviene añadir cosas como:

Los ficheros del IDE que estemos usando, por ejemplo, .idea o .vscode. Estos ficheros contienen setups específicos de nuestro ordenador, aparte de configuraciones que no interesa que tenga todo el equipo.
Fichero .env donde se ponen valores de variables de entorno, incluyendo claves de API y demás que se vayan a usar en el despliegue. La buena práctica en este sentido es usar siempre el mismo nombre de fichero, y que ese nombre de fichero esté en el .gitignore de la plantilla del repositorio de la empresa o squad.

Pulls y sus diferentes modalidades

Como git es un sistema de control de versiones distribuido, pull (y push) son los que permiten fusionar las historias de diversas procedencias. En general, debemos imaginarnos estas dos historias como dos ramas (literalmente, son ramas) de un árbol que, en un momento determinado, divergieron. Esas ramas tienen una serie de nudos, que son los commits. Fusionar implicar “ordenar” todos los nudos procedentes de las dos ramas en una sola rama, de forma que se incorporen las modificaciones de los dos lados. Vamos a imaginar por lo pronto que no hay ningún tipo de conflicto. Hay tres formas de hacer esto

Squash y fusionar. A veces la rama que uno quiere fusionar (de la que va a hacerse pull) tiene un montón de commits, algunos de los cuales pueden deshacer trabajo hecho anteriormente, o simplemente eliminar texto de depuración. Hacer squash convierte todos los commits en uno solo, y te reúne todos los mensajes de commit de forma que puedas editarlos, o borrarlos, para dejar sólo los que sean relevantes al resultado final.
Merge commit en este caso se crea un commit específico que dice que se han mergeado, y se re-firman los commits existentes con la firma de quien lo acepta. De todas las opciones, esta es la que se debe de tratar de no usar, salvo que haya un modelo de desarrollo con una sola persona encargada de trabajar con la rama principal.
Rebase and merge en este caso no se crea un merge commit, se aplican los commits de la rama, y encima se aplican los commits propios desde donde hayan divergido. Se reescribe la historia del repositorio de forma que provoque los mínimos problemas.

Pero ¿qué pasa si hay conflictos? El flujo de trabajo debe funcionar de forma que los conflictos se minimicen, con diferentes personas trabajando en diferentes partes del código. En ese caso mi experiencia es que es mejor optar por el merge commit, porque creará marcas en el fichero del conflicto que indiquen las dos versiones. En muchos casos no hay más remedio que mirar el código y tomar la versión que funcione; en otros casos, si sabemos que la versión buena es una de ellas, hacer

git checkout --theirs fichero
git checkout --ours fichero

En el primer caso la versión buena será la del repo del que estás haciendo pull, en el segundo la del propio.

Pull requests

Los pull requests (o merge requests en GitLab) son “peticiones de pull” o peticiones de incorporación a otro repositorio, es decir, una forma de indicarle a quien tenga permisos en repo que se quiere incorporar un cambio a la rama principal. Lo bueno es que GitHub te provee un interfaz gráfico para interaccionar con el cambio y también la persona que lo hace. Para empezar, se pueden crear plantillas en el repositorio en el cual se dé una estructura al pull request, tal como decir qué necesidad cubre o marcar si se han cumplido una serie de condiciones; a posteriori se puede comprobar, usando sistemas de integración continua, si se han cumplido esas condiciones.

Por eso, un pull request es una ocasión para revisar el código. Siempre hay que mirarlo, incluso aunque haya pasado los tests; puede haber mejoras que se pueden hacer sobre la marcha, en la rama desde la que se solicita el pull request. Pero lo principal de los mismos es que pueden limitarse para que no se pueda fusionar si no hay más de un número determinado de aceptaciones, por ejemplo. Eso anima al desarrollo colaborativo y permite comprobar la calidad del código como sólo los humanos saben hacerlo. Un flujo de trabajo en dónde sólo se acepta a la rama principal desde un pull request permite reducir la cantidad de errores y por tanto, desde el mismo origen, trabajar en la calidad del producto resultante.

Los PRs, igual que todos los push a la rama principal, pueden ir acompañados de una serie de tests específicos. Veremos más adelante en qué consisten y cómo programarlos.

Trabajando con ramas

En general, cualquier proyecto va a trabajar usando ramas como principal “lugar” de trabajo. En general, se desarrollará en una rama (siguiendo una historia de usuario, como se verá más adelante) y esa rama se incorporará a la principal tras la revisión por el resto del equipo.

Es conveniente que los nombres de las ramas sigan una serie de reglas, entre otras cosas porque el título del pull request que se haga se creará a partir de ese nombre. Y en muchos casos esos nombres vendrán dados automáticamente por el sistema en el que se esté trabajando, tal como Jira, por ejemplo. En todo caso, suelen seguir la convención xxx/yyy/zzz. En algún lado, y generalmente al final, debe haber algo que refleje qué es lo que hace la rama. Algunas convenciones que se pueden usar razonablemente son

usuario/titulo-del-issue, por ejemplo JJ/añade-hook. Así queda claro que es algo que uno está haciendo, y de qué va el tema.
Jira (del que oiremos hablar mucho) usa cosas un poco más complicadas, del tipo tipo/proyecto/issue/tarea, por ejemplo fix/HOOK/333/web-service que estaría trabajando sobre el ticket HOOK-333 que sería un fix o arreglo (puede ser una story o un epic, u otro tipo a medida que se haya creado).

Un nombre de rama razonable indicará a todo el mundo del equipo qué es lo que se está haciendo; y esto es importante porque siempre se programa para el futuro y para el equipo, no para uno mismo.

Recordad que para crear la rama, hacer push por primera vez a ella y en las veces sucesivas, habrá que hacer:

git checkout -b JJ/añade-hook
git push -u origin JJ/añade-hook # crea la rama remota y la asocia a esta
git push origin JJ/añade-hook

Como truco, se puede usar

git push origin $(git describe --contains --all HEAD)

que pusheará a la rama en la que se encuentre uno en ese momento (con -u si se trata de crear la rama remota)

Tagging y releasing

En el ciclo de vida de una base de código, los releases son puntos de control que se alcanzan al final de algún hito. Estos puntos de control permiten saber exactamente el estado de la base de código en ese momento, e incluso volver a ellos si hace falta corregir algún error.

En git se marcan los releases con un tag, que es simplemente una anotación (o etiqueta) que se añade a un commit determinado; es, por tanto, una forma de recordar un commit para volver a él si hace falta, o simplemente recuperar todos los ficheros en el estado que estaban en ese commit para hacer un release o un despliegue con todos ellos.

Para marcar, se usa git tag

git tag -a v0.0.1 -m "First release"

Tras la a se pone la versión, generalmente con una v delante, y usando “versionado semántico”, donde el primer número suele corresponder a una “major”, el siguiente a una “minor”, y el siguiente a point releases o versiones que mejoran algo sin hacer ninguna alteración al API.

A partir de ese tag, en GitHub se pueden crear releases desde la línea de órdenes o desde la web; estas releases crearán en la web un paquete con los ficheros, pero adicionalmente se pueden añadir otros ficheros binarios. Todos los ficheros generados deben ir en releases, no en el repositorio; por ejemplo, PDFs o .deb.

Una vez constituido un release con un tag, equivale a una rama ligera; se puede acceder al commit etiquetado con

git checkout v0.0.1

En realidad, se habrá obtenido el estado del repositorio tras un commit determinado, por lo que se quedará en una situación llamada detached HEAD, no asociado a ningún extremo del grafo de commits. Si se quiere trabajar a partir de ahí (para corregir un bug, por ejemplo), habrá que crear una rama a partir de ese commit:

git checkout -b rama-desde-tag

Esa rama podemos usarla como cualquier otra rama, desplegarla o fusionarla eventualmente con master.

Ver también

En el capítulo dedicado a integración continua dedicamos una sección a los hooks o ganchos de git, scripts que se ejecutan automáticamente alrededor de órdenes de git tales como commit o push.

GitHub (y posiblemente GitLab) se puede conectar fácilmente a sistemas de mensajería tales como Telegram o Slack, de forma que todos los cambios (o la mayoría; algunos puede que no vayan, como etiquetar un issue) vayan a parar a un grupo elegido; GitHubBot hace esa labor. Para un grupo de trabajo lo mejor es crear un grupo de Telegram y añadir el bot al ese grupo para que comunique todos los cambios; adicionalmente, si todos los miembros del grupo autorizan al bot a acceder al API en su nombre, se podrá interaccionar con GitHub directamente desde el grupo de Telegram.

Actividad

Esta actividad corresponderá al hito 0, y por tanto a versiones 0.x.y, y consisten en elegir un equipo para trabajar en el proyecto, y crear un repositorio usando esta plantilla, que contiene ya algunos tests y el diseño general, así como la licencia libre.

Inicialmente, el README.md sólo contendrá los nombres de los componentes del equipo, pero se trata de que en esta fase inicial se comience ya el hábito de añadir a la rama principal sólo con pull requests, de forma que el añadido de uno lo tendrá que aprobar otro (y otros) miembros del equipo.

Entrega

Esta entrega se llevará a cabo, como el resto de las mismas, como un pull request al fichero de proyectos, tras añadir en el fork propio el nombre del proyecto y un enlace al repo, así como la versión.

Usaremos versionado semántico para las entregas, donde el primer número será siempre el hito (comenzando por el hito 0). Diferentes versiones cambiarán el minor (el segundo) o el tercero, si son algunos cambios que no alteran el API ni la funcionalidad. Cada entrega corresponderá a un release, y por tanto el repositorio tendrá que tener un tag

Los tags se hacen con git tag, y para hacer push de los mismos se tendrá que hacer, adicionalmente al normal, git push --tags

que deberá corresponder exactamente a la versión que se haya enviado.

Para evitar errores más adelante, conviene que los issues que se creen no se cierren o, cuando se haga, se cierren con un commit.