iGabe s’est servi des chiffres de téléchargement de chansons sur iTunes Music Store publiés sur la page d’accueil d’Apple pour s’essayer à quelques statistiques. Voici la retranscription de son courriel :
Hello!
Je me suis amusé à faire des statistiques concernant les téléchargements sur l’imts, en me basant sur le compteur affiché sur la page d’Apple. Ca n’intéressera peut-être personne, mais moi ça m’amuse… Et pourtant j’aurai bien mieux à faire
Tout d’abord la technique:
1. un Applescript recharge à intervalle régulier la page d’Apple et extrait le nombre. (cette partie était plus compliquée que prévue, je pensais d’abord faire un simple script php qui regardait le code source, mais voilà dans le code source l’information désirée n’apparaît pas, on voit juste l’appel à une image, toujours la même: img src= »http://images.apple.com/home/images/2004/07/
itms100mnoscriptb20040701.gif ». Sympa le « noscript », ça m’a fait perdre quelques heures
. Un javascript s’occupe en fait de placer les bonnes images (9,4,2…). Le seul moyen est donc de récupérer ça directement dans le navigateur, et par chance, AppleScript permet cela. C’est même facile une fois que l’on sait comment faire… Heureusement, sinon il aurait fallu envisager un code pour la reconnaissance d’image….)
2. mon Applescript appel ensuite une page php locale en lui passant les deux paramètres importants: l’heure et le nombre de téléchargements
3. le script php enregistre cela dans une base de donnée mysql
4. un autre script récupère et analyse ces données. La difficulté provient du fait que a. l’échantillonage ne se fait pas de manière
régulière dans la temps (il manque parfois des échantillons) et b. le compteur sur la page Apple se met à jour toutes les 300 secondes mais ce n’est pas régulier non plus! Tout cela génère donc des imprécisions inévitables… Sans compter que pour ce concours un mail à itunes100@apple.com compte comme une entrée!
5. je compte faire un script php qui utilise jpgraph pour générer les graphiques en temps réel. Mais le temps me manque, j’ai donc pour l’instant fait cela manuellement dans matlab.
Et voici les résultats:

- itunes100m: nombre de téléchargements par seconde. La moyenne est faite sur un intervalle de 10 min. On remarque donc que les maximas de téléchargements (13 chansons/sec) ont lieu entre 22h et 24h (heure suisse). Les Européens sont pas encore couchés et c’est la fin de l’après-midi pour les Américains (les mômes rentrent de l’école 
Chaque barre verticale représente le franchissement des centaines de milliers (et donc un iPod offert). La première (à 0.1 environ
représente le franchissement des 95’300’000, la 2e, en pointillé, le franchissement des 95’400’000). Les lignes pointillées sont une
estimation, car ma connexion internet est des plus exécrable et coupe souvent, ce qui interrompt le processus). Chaque étoile bleue est une valeur effectivement mesurée, et il manque parfois des échantillons pendant plusieures heures….

- itunes100m_2: simplement le nombre total de téléchargement. Belle droite ascendante! On remarque néanmoins des bosses qui correspondent à l’accélération ou décélération du nombre de téléchargements.

-itunes100m_3: la même chose. les points rouges sont les valeurs effectivement mesurées, la ligne bleue est l’interpolation des valeurs manquantes… Sur la fin ça a l’air d’accélérer… A voir ces prochains jours…
Si le rythme restait constant on atteindrait les 100 millions le 12.07 à 21:51.
Si j’ai le temps, j’installe le script sur le serveur des forums pour suivre l’évolution de plus près.