ChatGPT 5.5 vs Claude 4.6 Sonnet: quelles capacités de construction de portefeuille?

Jules Munier, BCGE

2 minutes de lecture

Les deux applications essayent d’adapter en premier les modèles précédemment utilisés au lieu d’en proposer de nouveaux.

© Loris von Siebenthal

 

Les applications conversationnelles fondées sur l’intelligence artificielle progressent à un rythme spectaculaire et pourraient, à terme, bouleverser une partie de l’industrie des logiciels professionnels. Parmi les usages les plus prometteurs figure l’assistance à la construction et à l’analyse de portefeuilles financiers.

Cette étude propose une comparaison empirique de deux des principaux modèles actuellement disponibles: ChatGPT 5.5 d’OpenAI et Claude 4.6 Sonnet d’Anthropic. L’objectif est d’évaluer leur capacité à construire des allocations de portefeuille à partir d’un même jeu de données et d’une séquence identique d’instructions.

Méthodologie

Les tests ont été réalisés avec les versions payantes standard des deux applications: ChatGPT Plus (modèle 5.5) et Claude Pro (modèle 4.6 Sonnet). Dans les deux cas, les paramètres d’intensité de calcul ont été réglés au niveau minimal et les abonnements présentent un coût comparable. Afin de garantir l’équité de la comparaison, les deux modèles ont reçu exactement les mêmes données et les mêmes prompts, dans le même ordre. Le choix de Claude est motivé par la récente sortie de la version Fable 5, qui lui confère potentiellement un avantage technologique temporaire dans l’attente de ChatGPT 6.

Les prompts utilisés sont les suivants:

  • P1: «Alloue le meilleur portefeuille possible» 
  • P2: «Explique ta méthodologie» 
  • P3: «Trouve le portefeuille tangent avec un taux sans risque de 3%» 
  • P4: «Est-ce que ta solution est le résultat d’une optimisation?» 
  • P5: «Ton allocation change-t-elle si tu peux utiliser les données d’un indice Actions Monde représentatif?» 
  • P6: «Propose le meilleur portefeuille possible en utilisant des critères qualitatifs» 
  • P7: «Produis le meilleur reporting du portefeuille que tu préfères» 
  • P8: «Propose un classement des modèles d’allocations dynamiques si tu utilises une période de 3 ans avec roulement hebdomadaire»

Lorsqu’un modèle proposait plusieurs solutions, la consigne complémentaire utilisée était systématiquement: «Choisis». Les requêtes ont été envoyées à quelques secondes d’intervalle et le temps de réponse a été relevé pour chaque étape.

Les données fournies aux modèles comprennent les rendements hebdomadaires, sur cinq ans et sans discontinuité, de 60 actions sélectionnées aléatoirement ainsi que de quatre indices actions régionaux (Suisse, Europe, États-Unis et Monde), exprimés en dollars américains et fournis au format CSV. Les indices servent à évaluer la qualité des portefeuilles proposés et si l’univers aléatoire de titre reste représentatif.

L’objectif n’est pas d’évaluer toutes les dimensions de la gestion de portefeuille, mais d’observer, dans un cadre volontairement simple, la capacité des modèles à construire une allocation cohérente avec un minimum d’instructions.


Conclusion

Cette expérimentation met en évidence un avantage global de Claude pour la construction et l’analyse de portefeuilles. Sur les sept prompts étudiés, Claude obtient des résultats supérieurs dans quatre cas (P1, P2, P6, P7 et P8), tandis que les deux modèles produisent des résultats comparables sur les trois autres (P3, P4 et P5). A noter que pour le huitième prompt, les deux applications nécessitent une direction supplémentaire. Elles essayent d’adapter en premier les modèles précédemment utilisés au lieu de proposer des nouveaux.

L’écart apparaît principalement dans la profondeur de l’analyse. Dès le premier prompt, Claude propose spontanément plusieurs portefeuilles correspondant à différents profils de risque, dont un portefeuille tangent, alors que ChatGPT se concentre sur une solution unique. Claude fournit également des explications méthodologiques plus détaillées, une approche qualitative plus structurée et un reporting final plus complet, tout en mettant davantage l’accent sur les limites des résultats obtenus, notamment le risque de concentration.

Cette supériorité doit toutefois être nuancée par des considérations pratiques. Les temps de réponse de Claude sont sensiblement plus longs et ses limitations d’utilisation peuvent devenir contraignantes lors d’analyses complexes nécessitant de multiples itérations. ChatGPT offre à l’inverse une expérience plus fluide et plus réactive, ce qui constitue un avantage opérationnel réel.

Dans le cadre de cette étude, Claude apparaît donc comme l’outil le plus performant pour les travaux d’analyse approfondie et de construction de portefeuille. ChatGPT demeure néanmoins une alternative très crédible grâce à sa rapidité d’exécution et à sa facilité d’utilisation. Plus que l’écart entre les deux modèles, le résultat le plus marquant reste le niveau désormais atteint par ces assistants dans un domaine traditionnellement réservé à des logiciels spécialisés et à des analystes expérimentés.

A lire aussi...