OC où C1 = O est tel que En d'autres termes C1 est un vecteur dont les composantes ont uniquement valeurs 0, + 1, -1. La prédiction est où P1 = W × S1 conséquent prédiction de la performance relative, selon que X fera mieux que, pire que prévu ou ainsi que Y.
Le problème de programmation est que de calculer les coefficients de pondération W ainsi que les prédictions peuvent être faites.
Pour cela le programme agit comme une machine d'apprentissage, la modification des poids quand une mauvaise prédiction a été faite, jusqu'à ce que la totalité d'une séquence d'apprentissage de périodes de temps discrètes a été décrite avec précision le font. Supposons que l'utilisation des poids W une prédiction RT ont été réalisés sur XT de données et YT-à-dire Supposons en outre que la prédiction est fausse (RT est connue depuis les données est tout historique dans la séquence de formation) Laissez nouveaux poids W1 doivent être calculés de telle sorte que où A est un paramètre constant.
Il est clair que la prédiction est faite droit tant W1 peut être calculée. Nous avons et puisque les poids sont normalisés Nous pouvons séparons chaque somme en trois parties selon que le choix du signe dépend si X est meilleur ou pire que Y cours de la dernière période. On obtient alors un algorithme pour changer les coefficients de pondération lorsque une mauvaise prédiction a été faite.
Il est clair qu'il ne met bonne prédiction à la fois et peut ainsi (et le fait souvent) jeter certaines des prédictions précédentes, à savoir, quelques prédictions qui étaient correctes avec les anciens poids sont mal avec les nouvelles pondérations. La solution à cela est de parcourir l'histoire, de redresser des prédictions erronées comme ils se produisent jusqu'à ce que la totalité de l'histoire peut être prédit avec un ensemble de poids. Ainsi, le procédé est un processus itératif et. de sorte que le bien-fondé de la machine d'apprentissage à long terme.
La méthode de