Comment j’écris des tests unitaires

Temps de lecture : environ 8 min.

Les tests sont un des sujets qui m’occupe particulièrement cette dernière année. Et si c’est un sujet vaste où j’ai encore beaucoup à apprendre, je commence à me sentir enfin plus à l’aise sur les tests unitaires. Donc je vais vous partager quelques pratiques que j’essaie de suivre quand j’en écris. Elles sont pour la plupart issues de lectures (voir en fin d’article), associées à de la pratique régulière sur les projets pro et des katas. Je précise que ces pratiques sont des lignes directrices, et comme beaucoup de pratiques de développement, il faut faut savoir s’en écarter quand cela s’avère utile.

Why

Tout d’abord, voyons pourquoi j’écris des tests unitaires.

C’est un outil de conception

Pour moi aujourd’hui le plus important est leur capacité à faire émerger le design. En pratiquant TDD la plupart du temps je conçois grâce aux tests. Le code de test appelle le code de production, c’est un consommateur des abstractions (interfaces / contrats / API) proposées par le code de production, c’est donc un client comme un autre. Leur émergence correspond donc à un vrai besoin. La qualité des abstractions est un élément fondamental dans la complexité des logiciels. Les tests contribuent ainsi directement à une meilleure maîtrise de cette complexité. Je ne ferai pas ici de description de TDD, c’est un sujet qui mérite un article en soi, et il me faut encore acquérir de l’expérience pour pouvoir la partager. Je peux simplement vous partager que je ne code plus sans, et si parfois il m’arrive de bloquer et de revenir au papier crayon et aux diagrammes de séquence, je finis toujours par revenir au TDD.

C’est de la documentation

Avec des tests de qualité, il est plus facile de comprendre le fonctionnement d’un logiciel. Le code des tests nous permet de comprendre le besoin. Par exemple, quand je fais une revue de code , je commence par la lecture des tests. Si ceux-ci sont bien écrit je comprends plus vite le besoin et la conception que si j’attaquais directement par les implémentations.

C’est un filet de sécurité

Pour détecter un bug mais aussi et surtout lors d’un refactoring. Les tests sont verts ? On refactor en toute sécurité et ce n’est pas rien.

C’est un révélateur de code smell

Un test difficile à écrire est un révélateur d’un problème de conception. J’essaie de profiter autant que possible de ce signal pour remettre en question la qualité de ce que je suis en train d’écrire. Si mon test devient complexe, ce sera probablement le cas pour mon code de production, que ce soit pour les clients de mon API ou de l’implémentation.

Quand écrire un test unitaire ?

La raison d’être d’un test est un nouveau comportement. C’est la raison principale, et c’est le déclencheur le plus fréquent.

Parfois ça peut être des tests plus exploratoires, par exemple pour découvrir une API tierce, ou du code non couvert dans le cas d’un bug.

Quelles sont les frontières d’un test unitaire ?

Bon, je ne vous cache pas que c’est encore souvent un point dur sur lequel il m’arrive encore de buter. Dans les katas moins, mais dans un projet pro avec beaucoup de complexité j’ai plus de mal à trouver la bonne frontière. Mais les lignes directrices suivantes m’aident.

Trop souvent les tests vérifient des détails d’implémentation. Et très souvent je vois des stubs (collaborateur simulé avec une réponse prédéfinie) qui sont vérifiés alors que c’est un anti pattern comme indiqué plus haut. Les tests sont un client comme un autre de notre API, ils doivent donc connaître uniquement l’abstraction qu’ils testent.

Quand un ensemble de classes collaborent étroitement ensemble, je teste les fonctionnalités offertes par la classe qui expose cela via son API. Par exemple si un ensemble de classes sont impliquées dans un calcul complexe, je ne teste pas indépendamment chaque classe, mais l’ensemble des classes.
Ce qui va définir quels collaborateurs j’embarque et le périmètre de mon test :

le lien entre les collaborateurs (et qui contrôle la relation)
la complexité combinatoire : plus il y a de collaborateurs, plus il y a de chemins. Il y a donc des fois où il faudra soit ignorer des chemins (on prend le système comme une “boite grise” et non comme une “boite noire”), soit introduire des tests doubles pour limiter la complexité, soit tester les chemins indépendamment.
la performance, mes tests doivent être rapides. Par exemple je n’embarque pas les DAOs, je les mock (avec des stubs…), même si certains recommandent l’usage de testcontainers.

Une classe par fixture

Il est possible que la nécessité d’écrire beaucoup de méthodes de test soit un code smell. C’est peut être un signe que notre SUT (System Under Test) a trop de responsabilité. Mais ce n’est pas toujours le cas.

Quoiqu’il en soit, une classe de test trop grande devient vite illisible, et chaque développeur qui arrive sur ces classes aura tendance hélas à rajouter son cas de test plutôt que de faire l’effort de refactorer. On finit par se retrouver avec des tests dont la couverture se recoupe et qui deviennent inmaintenables. Or les logiciels doivent être conçus pour la facilité de lecture, pas d’écriture. J’essaie donc de garder cette exigence, de ne pas céder à la facilité de l’instant.

C’est pourquoi j’aime regrouper mes tests quand c’est nécessaire, soit dans des fichiers séparés, soit en utilisant les inner class avec @Nested de JUnit. C’est la fixture, c’est à dire ce qui permet d’initialiser les tests, qui me guide pour le regroupement de tests. Tous les tests qui partagent la même fixture sont regroupés.

Nommage des tests

Nommage de la classe

Certains nomment leurs classes avec le suffixe Should. En général je me contente de mettre [SystemUnderTest]Test. Si j’ai plusieurs classes pour mon SUT, alors je précise ce qui regroupe les tests.

Nommage des méthodes

Une méthode de test se lit comme une phrase. La phrase commence implicitement par l’objet du test, et la méthode de test indique ce qui est fait. Par exemple pour un objet Travel, qui a une méthode ItineraryType itineraryType() pour déterminer le type du voyage (international ou domestique), j’ai une méthode de test isDomesticWhenAllStationsAreInFrance. On lit donc la phrase “Travel is domestic when all stations are in France”. Vous pouvez voir d’autres exemples de ce nommage sur le wiki de Ward Cunningham.

Au boulot on applique une convention assez proche : chaque test commence par should, en séparant les mot par des underscores, ce qui donnerait pour l’exemple précédent : should_be_domestic_when_all_stations_are_in_france.

Le nommage du test ne sera peut-être pas correct du premier coup, mais il est important que l’on essaie de faire le mieux possible. Et il ne faut donc pas hésiter à les renommer quand on repasse dessus et que l’on ne saisit pas tout de suite le sens à cause du nommage. C’est aussi une question à se poser à la phase de refactoring en TDD.

Nommages dans les tests

Pour rapidement identifier ce qui ne marche pas dans un test ko, il est intéressant d’affecter des valeurs descriptives aux variables. Par exemple "id du client valide", plutôt que "abcde12345". Cela peut nous encourager à définir nos propres Value Types pour surcharger la méthode toString.
Il faut donc jouer sur le nom de la variable et sur son contenu.

Aussi, au lieu de passer null en paramètre, cela peut valoir le coup de nommer une variable qui est elle null. Cela facilite la lisibilité (oui, null en paramètre c’est moche). La variable est ainsi typée, c’est un dummy.

Structure

Concernant la structure, deux nommages sont pratiqués et équivalentes. Il suffit d’en choisir un et de s’y tenir.

// given ou arrange
ici le setup du test
// when ou act
l'appel au system under test
// then ou assert
les assertions

Assertions

Après avoir nommé le test, j’enchaîne par les assertions, en général. Il peut m’arriver plus rarement de commencer par le when. En tout cas, jamais par le given.

Tant que les assertions testent une feature cohérente, on peut en avoir autant que nécessaire. Il est en revanche inutile de répéter des assertions déjà vérifiées dans un autre test et c’est hélas une pratique que je trouve fréquemment et qui alourdit les tests inutilement.

Que doivent vérifier nos assertions ? J’applique ce que Sandi Metz a très bien résumé dans sa matrice.
On a des messages qui soit rentrent dans le SUT, soit sont internes au SUT, soit en sortent. Ces messages sont soit des queries (on attend un résultat) soit des commands (on attend un effet de bord). En fonction de ces types on effectue, ou pas, différents types de vérifications.

Message	Query	Command
Entrant	Assertions sur la réponse du SUT (sur l’état)	Assertions sur les effets de bord directs et publiques
Interne	Ne pas tester	Ne pas tester
Sortant	Ne pas tester	Tester uniquement ce qui est de la responsabilité du SUT. Vérifier avec un mock si le message a bien été envoyé

On voit donc qu’à aucun moment on ne fait d’assertion sur un collaborateur qui retourne un résultat (sortant / query), hors c’est une pratique que je vois très souvent, sous forme de verify sur des stubs (avec Mockito par exemple en Java).

Pour aller plus loin : When to mock et Mocks aren’t stubs.

When

Ensuite vient l’écriture du when, l’appel à notre SUT. Normalement on sait déjà ce que l’on attend comme retour car on a déjà écrit les assertions.
On doit donc finir de décrire l’abstraction de notre objet testé. Cette phase est très importante, la qualité des contrats (des abstractions plus globalement) étant fondamentale pour réduire la complexité des applications.

Given / Arrange

Puis on finit par la déclaration de ce qui est nécessaire pour initialiser le test. Ici il peut être intéressant d’utiliser des builders pour faciliter la création d’objets. Au boulot on expérimente actuellement leur utilisation conjointement au pattern Object Mother. On a des classes qui fournissent des builders déjà pré-initialisés et utile fréquemment pour nos tests. On a dons des given plus simples à lire, et des tests plus rapides à écrire. Tout cela est très bien décrit dans cet article.

Le chemin est encore long

Nous voilà à la fin de ce petit panorama de pratiques que j’applique pour mes tests. A travers cet article c’était une façon pour moi de tester mes connaissances sur les tests unitaires. Et si je n’ai fait que gratter la surface d’un sujet énorme, j’espère que vous y aurez trouvé quelques grains à moudre.

Ressources :

Test Driven Development By Example. Le livre de référence pour apprendre le TDD.
Growing Object-Oriented Software Guided by Tests. Un autre livre de référence, et une introduction au double loop tdd.
Practical Object-Oriented Design. Un livre très intéressant de Sandi Metz où les tests sont ne sont qu’une partie du livre, mais le livre vaut le coup dans sa globalité.
Don’t be mocked by your Mocks: Listening to your Tests. Très bonne vidéo de Victor Rentea.
Ian Cooper, conférence “TDD, Where Did It All Go Wrong”. J’ai pris une grosse claque en découvrant cette vidéo. Un must watch.