Curso de desarrollo para asegurar la calidad del software
Git es una herramienta para gestionar flujos de trabajo y equipos, y en combinación con GitHub/GitLab es imprescindible para gestionar los procesos de calidad del software que vamos a ver en este curso.
Los estudiantes conocerán las órdenes esenciales de git
, y como usar
la herramienta de línea de órdenes de GitHub para realizar algunas
tareas fundamentales; también sabrán cómo organizar flujos de
desarrollo usando pull requests y el concepto del mismo.
Se habrán formado equipos, y cada equipo habrá creado una descripción del mismo, con sus componentes en un README.md, todos los usuarios añadidos al repositorio, y tendrán que haber añadido sus nombre con un PR (que habrá aprobado algún otro miembro del equipo).
Comencemos con la creación del repositorio. Primero, haz las siguientes tareas para configurar correctamente git y GitHub.
A partir de ahí, vamos a empezar a trabajar con un repositorio directamente. Lo más rápido es crear repositorios directamente en GitHub
A partir de ahora, cuando diga GitHub se entenderá el sitio web que uses para alojar tus repositorios, GitHub, GitLab, BitBucket o el que corresponda; en algunos casos las características podrán no estar disponibles.
Hay tres formas de crearlos: directamente (opción New repository) desde el menú, haciendo un fork o copia de un repositorio existente (lo que se aconseja, principalmente, si vas a trabajar con ese repositorio) o bien creándolos a partir de una plantilla o template. Esto sólo se puede hacer con repositorios que han sido marcados para ello, como el repositorio de este curso; si lo permite, la opción Use this template te permitirá crear tu propio repositorio usando los ficheros existentes. Esta opción tiene la ventaja de que el repositorio no aparece como un fork, y además tienes una serie de ficheros para comenzar rápidamente.
Aconsejamos también que se instale
hub
, la línea de órdenes de GitHub. Con ella se puede acceder directamente, desde git, a funcionalidades del propio GitHub; por ejemplo, descargar repos sólo con el nombre, o acceder a issues.
Una vez creado el repositorio, se descarga con
git clone mirepo # Si tienes hub instalado
git clone git@github.com:minick/mirepo
El ciclo básico de git consiste en usar
add
, push
, pull
y commit
. No vamos a entrar demasiado en eso,
pero deberías saber cómo usarlos. Sí vamos a ver flujos de trabajo
basados en pull requests y dedicar un poco de espacio al formato de
los mensajes de commit.
Los mensajes de commit son predicados (el sujeto es el cambio al que se ha sometido), deben ser atómicos, referirse siempre a un issue (y en GitHub puedes indicar qué issue simplemente con # + número del mismo) y usar 50 caracteres si es una sola línea, o 50 + línea en blanco + líneas de 80 caracteres si se trata de más líneas.
Pero adicionalmente, puedes
usar
una estructura convencional para
que sean más informativos y permitan, de un vistazo, saber qué es lo
que hacen y a qué se refieren. También puedes
usar gitmojis, símbolos que se
introducen en un commit entre dos puntos; por ejemplo, :+1: sería el
símbolo del pulgar hacia arriba o :see_no_evil:
el que se usa cuando
se añade algo al fichero .gitignore
. Pero se pueden usar muchos
otros gitmojis, y os animo a que lo hagáis, porque permiten, de un
vistazo, saber de qué va el commit.
.gitignore
y su importanciaYa que mencionamos el fichero .gitignore
, más allá de ser algo que
evita la molestia de que aparezcan en el status cosas que en realidad
no nos interesan, es verdaderamente parte integral de la seguridad de
una aplicación. Para empezar, hay que tener en cuenta que afecta a el
directorio en el que se encuentra y todos los que hay por debajo; por
eso es habitual tener un .gitignore en el directorio raíz. Pero
también se pueden crear en subdirectorios específicos si esos
subdirectorios usan un lenguaje diferente o simplemente hay ficheros
en ellos que no nos interesa que estén.
De forma general, en .gitignore estarán todos los ficheros generados, pero también conviene añadir cosas como:
Los ficheros del IDE que estemos usando, por ejemplo, .idea
o
.vscode
. Estos ficheros contienen setups específicos de nuestro
ordenador, aparte de configuraciones que no interesa que tenga todo
el equipo.
Fichero .env
donde se ponen valores de variables de entorno,
incluyendo claves de API y demás que se vayan a usar en el
despliegue. La buena práctica en este sentido es usar siempre el
mismo nombre de fichero, y que ese nombre de fichero esté en el
.gitignore
de la plantilla del repositorio de la empresa o
squad.
Como git
es un sistema de control de versiones distribuido, pull
(y push
) son los que permiten fusionar las historias de diversas
procedencias. En general, debemos imaginarnos estas dos historias como
dos ramas (literalmente, son ramas) de un árbol que, en un momento
determinado, divergieron. Esas ramas tienen una serie de nudos, que
son los commits. Fusionar implicar “ordenar” todos los nudos
procedentes de las dos ramas en una sola rama, de forma que se
incorporen las modificaciones de los dos lados. Vamos a imaginar por
lo pronto que no hay ningún tipo de conflicto. Hay tres formas de
hacer esto
Squash y fusionar. A veces la rama que uno quiere fusionar (de la que va a hacerse pull) tiene un montón de commits, algunos de los cuales pueden deshacer trabajo hecho anteriormente, o simplemente eliminar texto de depuración. Hacer squash convierte todos los commits en uno solo, y te reúne todos los mensajes de commit de forma que puedas editarlos, o borrarlos, para dejar sólo los que sean relevantes al resultado final.
Merge commit en este caso se crea un commit específico que dice que se han mergeado, y se re-firman los commits existentes con la firma de quien lo acepta. De todas las opciones, esta es la que se debe de tratar de no usar, salvo que haya un modelo de desarrollo con una sola persona encargada de trabajar con la rama principal.
Rebase and merge en este caso no se crea un merge commit, se aplican los commits de la rama, y encima se aplican los commits propios desde donde hayan divergido. Se reescribe la historia del repositorio de forma que provoque los mínimos problemas.
Pero ¿qué pasa si hay conflictos? El flujo de trabajo debe funcionar de forma que los conflictos se minimicen, con diferentes personas trabajando en diferentes partes del código. En ese caso mi experiencia es que es mejor optar por el merge commit, porque creará marcas en el fichero del conflicto que indiquen las dos versiones. En muchos casos no hay más remedio que mirar el código y tomar la versión que funcione; en otros casos, si sabemos que la versión buena es una de ellas, hacer
git checkout --theirs fichero
git checkout --ours fichero
En el primer caso la versión buena será la del repo del que estás haciendo pull, en el segundo la del propio.
Los pull requests (o merge requests en GitLab) son “peticiones de pull” o peticiones de incorporación a otro repositorio, es decir, una forma de indicarle a quien tenga permisos en repo que se quiere incorporar un cambio a la rama principal. Lo bueno es que GitHub te provee un interfaz gráfico para interaccionar con el cambio y también la persona que lo hace. Para empezar, se pueden crear plantillas en el repositorio en el cual se dé una estructura al pull request, tal como decir qué necesidad cubre o marcar si se han cumplido una serie de condiciones; a posteriori se puede comprobar, usando sistemas de integración continua, si se han cumplido esas condiciones.
Por eso, un pull request es una ocasión para revisar el código. Siempre hay que mirarlo, incluso aunque haya pasado los tests; puede haber mejoras que se pueden hacer sobre la marcha, en la rama desde la que se solicita el pull request. Pero lo principal de los mismos es que pueden limitarse para que no se pueda fusionar si no hay más de un número determinado de aceptaciones, por ejemplo. Eso anima al desarrollo colaborativo y permite comprobar la calidad del código como sólo los humanos saben hacerlo. Un flujo de trabajo en dónde sólo se acepta a la rama principal desde un pull request permite reducir la cantidad de errores y por tanto, desde el mismo origen, trabajar en la calidad del producto resultante.
Los PRs, igual que todos los push a la rama principal, pueden ir acompañados de una serie de tests específicos. Veremos más adelante en qué consisten y cómo programarlos.
En general, cualquier proyecto va a trabajar usando ramas como principal “lugar” de trabajo. En general, se desarrollará en una rama (siguiendo una historia de usuario, como se verá más adelante) y esa rama se incorporará a la principal tras la revisión por el resto del equipo.
Es conveniente que los nombres de las ramas sigan una serie de
reglas, entre otras cosas porque el título del pull request que se
haga se creará a partir de ese nombre. Y en muchos casos esos nombres
vendrán dados automáticamente por el sistema en el que se esté
trabajando, tal como Jira, por ejemplo. En todo caso, suelen seguir la
convención xxx/yyy/zzz
. En algún lado, y generalmente al final, debe
haber algo que refleje qué es lo que hace la rama. Algunas
convenciones que se pueden usar razonablemente son
usuario/titulo-del-issue
, por ejemplo JJ/añade-hook
. Así queda
claro que es algo que uno está haciendo, y de qué va el tema.tipo/proyecto/issue/tarea
, por ejemplo
fix/HOOK/333/web-service
que estaría trabajando sobre el ticket
HOOK-333 que sería un fix o arreglo (puede ser una story
o un
epic
, u otro tipo a medida que se haya creado).Un nombre de rama razonable indicará a todo el mundo del equipo qué es lo que se está haciendo; y esto es importante porque siempre se programa para el futuro y para el equipo, no para uno mismo.
Recordad que para crear la rama, hacer push por primera vez a ella y en las veces sucesivas, habrá que hacer:
git checkout -b JJ/añade-hook
git push -u origin JJ/añade-hook # crea la rama remota y la asocia a esta
git push origin JJ/añade-hook
Como truco, se puede usar
git push origin $(git describe --contains --all HEAD)
que pusheará a la rama en la que se encuentre uno en ese momento (con
-u
si se trata de crear la rama remota)
En el ciclo de vida de una base de código, los releases son puntos de control que se alcanzan al final de algún hito. Estos puntos de control permiten saber exactamente el estado de la base de código en ese momento, e incluso volver a ellos si hace falta corregir algún error.
En git se marcan los releases con un tag, que es simplemente una anotación (o etiqueta) que se añade a un commit determinado; es, por tanto, una forma de recordar un commit para volver a él si hace falta, o simplemente recuperar todos los ficheros en el estado que estaban en ese commit para hacer un release o un despliegue con todos ellos.
Para marcar, se usa git tag
git tag -a v0.0.1 -m "First release"
Tras la a
se pone la versión, generalmente con una v delante, y
usando “versionado semántico”, donde el primer número suele
corresponder a una “major”, el siguiente a una “minor”, y el siguiente
a point releases o versiones que mejoran algo sin hacer ninguna
alteración al API.
A partir de ese tag, en GitHub se pueden crear releases desde la
línea de órdenes o desde la web; estas releases crearán en la web un
paquete con los ficheros, pero adicionalmente se pueden añadir otros
ficheros binarios. Todos los ficheros generados deben ir en
releases, no en el repositorio; por ejemplo, PDFs o .deb
.
Una vez constituido un release con un tag, equivale a una rama ligera; se puede acceder al commit etiquetado con
git checkout v0.0.1
En realidad, se habrá obtenido el estado del repositorio tras un commit determinado, por lo que se quedará en una situación llamada detached HEAD, no asociado a ningún extremo del grafo de commits. Si se quiere trabajar a partir de ahí (para corregir un bug, por ejemplo), habrá que crear una rama a partir de ese commit:
git checkout -b rama-desde-tag
Esa rama podemos usarla como cualquier otra rama, desplegarla o
fusionarla eventualmente con master
.
En el capítulo dedicado a integración continua dedicamos una
sección a los hooks o ganchos de git, scripts que se ejecutan
automáticamente alrededor de órdenes de git tales como commit
o push
.
GitHub (y posiblemente GitLab) se puede conectar fácilmente a sistemas de mensajería tales como Telegram o Slack, de forma que todos los cambios (o la mayoría; algunos puede que no vayan, como etiquetar un issue) vayan a parar a un grupo elegido; GitHubBot hace esa labor. Para un grupo de trabajo lo mejor es crear un grupo de Telegram y añadir el bot al ese grupo para que comunique todos los cambios; adicionalmente, si todos los miembros del grupo autorizan al bot a acceder al API en su nombre, se podrá interaccionar con GitHub directamente desde el grupo de Telegram.
Esta actividad corresponderá al hito 0, y por tanto a versiones
0.x.y
, y consisten en elegir un equipo para trabajar en el proyecto, y crear un
repositorio
usando esta plantilla,
que contiene ya algunos tests y el diseño general, así como la
licencia libre.
Inicialmente, el README.md
sólo contendrá los nombres de los
componentes del equipo, pero se trata de que en esta fase inicial se
comience ya el hábito de añadir a la rama principal sólo con pull
requests, de forma que el añadido de uno lo tendrá que aprobar otro
(y otros) miembros del equipo.
Esta entrega se llevará a cabo, como el resto de las mismas, como un pull request al fichero de proyectos, tras añadir en el fork propio el nombre del proyecto y un enlace al repo, así como la versión.
Usaremos versionado semántico para las entregas, donde el primer número será siempre el hito (comenzando por el hito 0). Diferentes versiones cambiarán el minor (el segundo) o el tercero, si son algunos cambios que no alteran el API ni la funcionalidad. Cada entrega corresponderá a un release, y por tanto el repositorio tendrá que tener un tag
Los tags se hacen con
git tag
, y para hacer push de los mismos se tendrá que hacer, adicionalmente al normal,git push --tags
que deberá corresponder exactamente a la versión que se haya enviado.
Para evitar errores más adelante, conviene que los issues que se creen no se cierren o, cuando se haga, se cierren con un commit.