19.06.2012
Aucune réaction

Xavier Conort : "mon programme attribue des notes plus fiables que le professeur moyen"

Xavier Conort, expert en ana­lyse de don­nées, a fini dans le top 5 d'un concours de pro­gram­ma­tion visant à réa­li­ser le meilleur pro­gramme de nota­tion auto­ma­tique de dis­ser­ta­tions. Pour lui, l'utilisation de tels pro­grammes pour­rait mettre fin aux notes injustes.

Xavier Conort expert en analyse de donnéesXavier Conort, 39 ans, ancien actuaire pour des com­pa­gnies d'assurances et aujourd'hui à la tête du cabi­net de conseil en ana­lyse de don­nées Gear Analytics, a par­ti­cipé cette année à la com­pé­ti­tion ASAP. Ce concours visait à récom­pen­ser le meilleur logi­ciel de nota­tion auto­ma­tique de dis­ser­ta­tions, celui qui se rap­pro­che­rait le plus des notes don­nées par un cor­rec­teur humain.

Longtemps en tête du clas­se­ment, l'équipe de Xavier a fini en 4ème posi­tion sur les 159 équipes en lice. Il nous explique com­ment il a pu réa­li­ser un pro­gramme aussi per­for­mant pour noter des copies d'élèves, sans rien connaître du monde de l'éducation.

Comment avez-vous conçu votre pro­gramme de nota­tion automatique ?

J'ai uti­lisé dif­fé­rents algo­rithmes de machine lear­ning, des algo­rithmes qui per­mettent à l'ordinateur d'apprendre par lui-même. Ils ont été déve­lop­pés dans les années 1990 et 2000 par de brillants sta­tis­ti­ciens ensei­gnant à Stanford ou Berkeley, qui ont décidé d'abandonner les maths pures et de lais­ser la machine ana­ly­ser des don­nées pour eux.

Nous avions à notre dis­po­si­tion un trai­ning set, un lot de rédac­tions avec les notes de cor­rec­teurs humains, pour cali­brer la machine. Une matrice m'a per­mis d'en extraire le voca­bu­laire uti­lisé par les étudiants, et de mesu­rer la fré­quence d'utilisation des mots. Les algo­rithmes per­mettent ensuite de mesu­rer l'impact de chaque mot sur la note. C'est ainsi que la machine apprend à recon­naître le voca­bu­laire uti­lisé par les bons élèves, et le voca­bu­laire — ou l'absence de voca­bu­laire — des moins bons élèves ou des élèves hors sujet, et elle attri­bue des notes en consé­quence. C'est la même tech­nique qu'utilisent les logi­ciels de recon­nais­sance de "spams".

Les rédac­tions étaient en anglais, cela a-t-il été un obstacle ?

Non, cela aurait pu être n'importe quelle langue, le prin­cipe est le même. Je n'ai pas lu les copies !

Quel est le secret de l'efficacité de votre pro­gramme, qui a fini dans le top 5 ?

Il faut com­bi­ner plu­sieurs algo­rithmes, qui abordent un même pro­blème dif­fé­rem­ment, pour avoir des résul­tats consis­tants. C'est la théo­rie du livre The Wisdom of crowds ("la sagesse des foules") : on obtient une meilleure réponse à un pro­blème donné en fai­sant la moyenne d'opinions de gens très dif­fé­rents, plu­tôt qu'en fai­sant appel à une seule per­sonne, même très compétente.

Je l'ai donc appli­quée à mon pro­jet, en uti­li­sant dif­fé­rents algo­rithmes plu­tôt qu'un seul : Support Vector Machine, Regularized regres­sion, Random Forest, Gradient Boosting Machine, Genetic algo­rithm... Mais je l'ai aussi appli­quée à mon équipe de com­pé­ti­tion, en choi­sis­sant comme par­te­naire Marcin Pionnier, un Polonais, qui avait étudié l'informatique (moi les sta­tis­tiques), et qui uti­li­sait un autre logi­ciel. Notre seul point com­mun était d'avoir tra­vaillé pour des com­pa­gnies d'assurances ! On pro­gresse davan­tage en confron­tant ses idées avec quelqu'un de très différent.

Pour vous, serait-il sou­hai­table de confier l'évaluation des exa­mens à une machine ? Est-ce qu'il ne serait pas plus facile de tri­cher avec un cor­rec­teur infor­ma­tisé qu'avec un humain ?

Le risque de triche existe en effet avec la machine. Mais l'étudiant peut aussi être péna­lisé par l'humain. J'ai détecté grâce à mon algo­rithme un nombre signi­fi­ca­tif de rédac­tions mal notées (sur– ou sous-notées). Les deux sys­tèmes de nota­tion sont donc à mes yeux com­plé­men­taires. Les résul­tats obte­nus dans cette com­pé­ti­tion montrent que la machine attri­bue des notes plus fiables qu'un pro­fes­seur amé­ri­cain moyen ! Ironiquement, je pense que ces algo­rithmes pour­raient être plus utiles pour noter les pro­fes­seurs que les élèves. Ils pour­raient ser­vir à iden­ti­fier ceux qui notent de façon erra­tique, et ainsi éviter que des élèves ne se voient attri­buer des notes tota­le­ment injustes.

Un pro­fes­seur de mathé­ma­tiques ou d'informatique pourrait-il faci­le­ment par­ti­ci­per, comme vous, à des com­pé­ti­tions de data mining (ana­lyse de données) ?

Avec de la moti­va­tion et de la téna­cité, n'importe qui peut le faire, de n'importe où, sans aucune res­source. Avant sep­tembre, je ne connais­sais rien aux algo­rithmes que j'utilise aujourd'hui. Il existe un livre gra­tuit de 800 pages, The ele­ments of sta­tis­ti­cal lear­ning, rédigé par trois pro­fes­seurs de Stanford, qui réper­to­rie les tech­niques les plus uti­li­sées en machine lear­ning. Et pour pro­gram­mer, j'utilise le logi­ciel gra­tuit R. Cela prend bien sûr du temps, et il faut un peu coder. Il vaut donc mieux avoir un cur­sus scien­ti­fique et être à l'aise avec un ordinateur.

Comptez-vous par­ti­ci­per aux pro­chains volets du chal­lenge ASAP, l'évaluation auto­ma­ti­sée de réponses courtes et de gra­phiques mathématiques ?

La pro­ba­bi­lité que j'y par­ti­cipe est très forte. Les com­pé­ti­tions en data mining sont addictives !


Propos recueillis par

Quentin Duverger

Vous souhaitez réagir sur cet article :

Open-close

Modération par la rédaction de VousNousIls.

Conformément à la loi relative à l'informatique, aux fichiers et aux libertés, vous disposez d'un droit d'accès, de modification, de rectification et de suppression des données vous concernant. Pour exercer ce droit adressez-vous à CASDEN Banque Populaire, VousNousIls.fr, 91 Cours des roches, Noisiel, 77424 Marne La Vallée Cedex 2.

Vos réactions :

Open-close
Aucune réaction