L'architecture générale d'une application informatique, en ce qui concerne son utilisation d'un CPU est la suivante :
Pour opérer sur les données, elles sont tirées du disque dur, et mises en RAM, au fur et à mesure que les opérations sont opérées cependant, elles sont ensuite déplacées de la RAM dans les caches des CPU, les 2/3 sont pour les données qui sont moins susceptibles d'être immédiatement utilisées, et les caches L1 contiennent les données qui sont très susceptibles d'être utilisées, ou qui sont en cours d'action actuellement.
La raison pour laquelle cela se produit est que :
Un]. Les applications peuvent sembler petites, mais en termes de ce qu'un CPU peut agir dans un seul processus, elles sont des ordres de grandeur plus importants, et la plupart de l'application elle-même n'aura pas besoin d'être traitée dans certains cas.
B] La RAM retient les données beaucoup plus efficacement que le stockage, il faut des ordres de grandeur plus longs pour tirer des données d'un disque dur que de la RAM.
C] Les caches, ( L3/L2/L1) sont tous utilisés en fonction de la proximité ou de la probabilité d'exécution du code, où L1 est immédiatement opérable/très probable, L2 est assez probable, L3 etc.
Donc le pipeline pour un processus d'exploitation est il est tiré du disque dur lorsque l'application elle-même est appelée.
Alors que le code est en train d'être actionné, il est tiré dans le cache.
Une fois que le code a terminé son action, il sera alors rejeté vers le cache ou vers la RAM.