Modélisation spatiale d’un plasma à l’aide de réseaux de neurones profonds
Le transport des électrons dans les plasmas à basse température dépend fortement de la fonction de distribution d’énergie des électrons (EEDF), qui est souvent considérée comme maxwellienne, mais qui, en réalité, est souvent hors équilibre. L’intégration du comportement hors équilibre de l’EEDF dans des modèles à dépendance spatiale nécessite souvent des tables de correspondance multidimensionnelles précalculées ou la résolution cohérente de l’équation de Boltzmann durant la simulation. Cet article de blog présente une alternative plus efficace: un modèle de substitution à réseau de neurones profond entraîné sur les solutions de l’équation de Boltzmann. Cela permet d’intégrer avec précision les effets cinétiques dans les simulations de plasma fluide tout en réduisant considérablement le coût de calcul.
Méthodologies pour l’intégration de données cinétiques dans des modèles spatiaux de dynamique des fluides
Dans les plasmas froids, les propriétés de transport des électrons et les termes sources sont très sensibles à la fonction de distribution d’énergie des électrons (EEDF). Pour simplifier, on considère souvent une EEDF maxwellienne ou d’autres formes analytiques. Cependant, dans de nombreuses situations pratiques, les électrons sont loin de l’équilibre, et une représentation plus précise de l’EEDF est nécessaire pour obtenir des résultats de simulation réalistes.
Une méthode courante et efficace pour calculer l’EEDF dans les plasmas à basse température consiste à résoudre l’équation de Boltzmann en utilisant l’approximation à deux termes. Ces EEDF calculées peuvent ensuite être importées dans des modèles à dépendance spatiale, comme décrit dans un précédent article de blog: The Boltzmann Equation, Two-Term Approximation Interface. Cette approche est à la fois efficace et pratique, mais elle présente une limitation majeure: les EEDF obtenues ne sont que des fonctions de l’énergie moyenne des électrons. Par conséquent, les variations dues aux changements de composition du gaz (fractions molaires) et au degré d’ionisation ne peuvent pas être prises en compte.
Le module Plasma, un module complémentaire de COMSOL Multiphysics®, offre quant à lui la possibilité de résoudre l’équation de Boltzmann (dans l’approximation à deux termes) entièrement couplée à un modèle de fluide plasma résolu dans l’espace et dans le temps. Cette méthode, comme le montre le modèle GEC ICP Reactor, tient automatiquement compte des variations de la composition du gaz (y compris les états excités), du degré d’ionisation et d’autres facteurs. Cependant, cette approche entièrement couplée entraîne un coût de calcul nettement plus élevé.
Une troisième approche consiste à développer un modèle de substitution à réseau de neurones profond (DNN) entraîné à partir de données générées par l’équation de Boltzmann résolue à l’aide de l’approximation à deux termes. Une fois entraîné, le DNN peut être intégré directement dans des simulations de plasmas à dépendance spatiale afin de reproduire les effets cinétiques avec une précision proche de celle de Boltzmann. En combinant la précision de la modélisation cinétique et l’efficacité de calcul des modèles fluidiques, cette méthode hybride offre un bon compromis entre précision et performance.
Génération des données pour le modèle de substitution
La première étape consiste à disposer d’un modèle de plasma dépendant de l’espace qui peut être résolu à l’aide d’une EEDF analytique. Dans cet exemple, nous utilisons un modèle de réacteur plasma d’argon à couplage inductif. Dans le même fichier MPH, ajoutez un composant 0D avec l’interface Équation de Boltzmann, approximation à deux termes. Cette interface génère les données nécessaires à la construction du modèle de substitution.
Réglages de l’interface Equation de Boltzmann, approximation à deux termes .
Il est important que les réactions d’impact électronique définies dans l’interface Equation de Boltzmann, approximation à deux termes et l’interface Plasma soient cohérentes, mais pas nécessairement identiques. Par exemple, la résolution de l’équation de Boltzmann approximée peut comporter un ensemble détaillé de réactions d’impact électronique, tandis que l’interface Plasma peut inclure une réaction unique simplifiée représentant l’ionisation totale. Dans cet exemple, nous utilisons une correspondance une à une entre les réactions.
Ensuite, ajoutez une nouvelle étude pour calculer les données nécessaires à l’entraînement du modèle de substitution. Dans cette étude, incluez un noeud Apprentissage du modèle de substitution. Ce noeud vous permet de sélectionner les paramètres d’entraînement et de définir les quantités de sortie (ou quantités d’intérêt). L’entraînement à proprement parler est effectué dans le noeud Réseau de neurones profond, qui est créé automatiquement après avoir exécuté l’étude.
Dans le noeud Apprentissage du modèle de substitution, il est important de:
- Sélectionner Réseau de neurones profond comme type de modèle de substitution.
- Définir les couches du réseau de neurones et la fonction d’activation.
- Définir les quantités d’intérêt et pour chacune, utiliser l’option Configurer une entrée dépendant de l’étude
- Définir les paramètres d’entrée et la méthode d’échantillonnage.
Les quantités d’intérêt correspondent aux résultats du modèle de substitution utilisés ultérieurement dans le modèle de plasma dépendant de l’espace. Pour cet exemple, celles-ci comprennent des fonctions pour toutes les constantes de taux d’impact des électrons, la mobilité réduite des électrons, la fréquence de collision réduite effective des électrons et le coefficient de champ. Il convient de noter que la mobilité réduite des électrons fait référence à la mobilité DC utilisée pour le transport des électrons dans le plan, tandis que la fréquence de collision effective et le facteur de champ contribuent au calcul de la conductivité du plasma (comme détaillé dans la Réf. 1).
Le choix des paramètres d’entrée doit être adapté à chaque cas spécifique. Pour cet exemple, outre la paramétrisation de l’énergie moyenne des électrons, qui est toujours requise, nous échantillonnons également le degré d’ionisation (Beta), défini comme le rapport entre la densité électronique et la densité gazeuse, ainsi que la fraction molaire de l’état excité de l’argon (xArs). Pour rendre compte efficacement de l’influence de ces entrées sur les sorties, seuls quelques points d’échantillonnage par décade sont nécessaires, ce que nous obtenons grâce à un échantillonnage uniforme dans le domaine logarithmique.
Réglages du noeud Apprentissage du modèle de substitution montrant les couches du DNN et les quantités d’intérêt.
Réglages du noeud Apprentissage du modèle de substitution montrant la section Paramètres d’entrée.
Entraînement du réseau de neurones profond
Après avoir lancé l’étude contenant le noeud Apprentissage du modèle de substitution, un noeud Réseau de neurones profond est automatiquement créé sous Définitions globales. C’est là que se déroule l’entraînement proprement dit du DNN. Avant de commencer, quelques ajustements importants doivent être effectués.
L’utilisation de l’option Mise à l’échelle log dans le réglage Mise à l’échelle est essentielle pour de nombreuses quantités d’intérêt, car elles présentent souvent une croissance quasiment exponentielle par rapport aux entrées. Une mise à l’échelle logarithmique de ces sorties améliore les performances d’entraînement en équilibrant efficacement les erreurs sur plusieurs ordres de grandeur. Pour garantir un entraînement suffisant, il convient de sélectionner un Nombre d’epochs compris entre 10 000 et 30 000.
Une fois ces réglages effectués, vous pouvez cliquer sur Entraîner le modèle pour commencer à entraîner le réseau de neurones.
Une capture d’écran des réglages du noeud Réseau de neurones profond montrant les Réglages de la colonne de données.
Évaluation des quantités d’intérêt et visualisation de la qualité de l’entraînement
Pour visualiser les sorties du réseau neurones, il suffit de cliquer sur le bouton Créer un graphique dans la fenêtre Réglages. Dans cet exemple, nous voulons générer des graphiques 1D en fonction de l’énergie moyenne des électrons. Pour cela, on peut modifier les réglages de la section Paramètres d’affichage comme indiqué dans la figure ci-dessous, puis cliquer sur Créer un graphique. Cette action crée un graphique de la constante de vitesse pour la réaction d’impact électronique 4, avec la fraction molaire de l’état excité de l’argon et le degré d’ionisation tous deux fixés à 10-6. Un jeu de données Grille 1D est également créé automatiquement; il peut être utilisé pour des évaluations supplémentaires et pour tracer la fonction du réseau de neurones.
Une capture d’écran du noeud Réseau de neurones profond montrant les réglages des paramètres d’affichage.
Chaque quantité d’intérêt peut être évaluée à l’aide d’un nom de fonction construit à partir du nom de fonction défini dans le noeud Surrogate Model Training, préfixé par le nom du DNN. Par exemple, la constante de vitesse pour la réaction d’impact électronique 4 peut être évaluée à l’aide de:
dnn1_k_4( Argument_1 , Argument_2, Argument_3)
où Argument_1 , Argument_2 et Argument_3 désignent respectivement le log10 de la fraction molaire de l’argon à l’état excité, le log10 du degré d’ionisation et l’énergie électronique moyenne.
Les figures ci-dessous montrent une comparaison entre les données calculées à l’aide de l’interface Equation de Boltzmann, approximation à deux termes et les évaluations correspondantes issues du réseau neuronal entraîné pour deux grandeurs d’intérêt: la mobilité des électrons et le coefficient de taux d’ionisation à partir de l’état fondamental. Ces résultats sont représentés sous forme de fonctions de l’énergie moyenne des électrons pour xAsr = Beta = 10-6, 10-4 et 10-3. A titre de référence, les valeurs calculées en supposant une EEDF maxwellienne sont également incluses. Dans l’ensemble, le réseau de neurones fournit une très bonne approximation des données calculées dans tout l’espace des paramètres.
Comme le montre le graphique, les quantités calculées à l’aide de l’interface Equation de Boltzmann, approximation à deux termes diffèrent considérablement de celles calculées à l’aide d’une distribution maxwellienne, en particulier dans le régime des basses énergies, où opèrent la plupart des réacteurs à plasma froid. Cela souligne non seulement l’importance d’un calcul précis de l’EEDF, mais aussi la dépendance significative des taux de transport et de réaction tant à l’égard de la fraction molaire de l’argon à l’état excité qu’à l’égard du degré d’ionisation.
Coefficient de taux d’ionisation à partir de l’état fondamental en fonction de l’énergie moyenne des électrons pour une fraction molaire d’Ars et un degré d’ionisation valant 10-6, 10-4 et 10-3. Les lignes pleines (bleues, rouges et vertes) représentent les résultats du modèle de substitution et les symboles (cercles ouverts) sont les données calculées à l’aide de l’interface Equation de Boltzmann, approximation à deux termes.
Mobilité réduite des électrons en fonction de l’énergie moyenne des électrons pour une fraction molaire d’Ars et un degré d’ionisation valant 10-6, 10-4 et 10-3. Les lignes pleines (bleues, rouges et vertes) représentent les résultats du modèle de substitution et les symboles (cercles ouverts) sont les données calculées à l’aide de l’interface Equation de Boltzmann, approximation à deux termes.
Utilisation de DNN dans un modèle dépendant de l’espace
Pour utiliser les DNN dans un modèle de plasma dépendant de l’espace, il suffit de les appeler en tant que fonctions, de la même manière que vous le feriez avec n’importe quelle expression définie par l’utilisateur, comme le montrent les figures ci-dessous. Dans cet exemple, nous remplaçons tous les coefficients de taux d’impact des électrons, la mobilité réduite des électrons, la fréquence de collision effective et le coefficient de champ. Il est important de noter que l’extrapolation en dehors de la plage des données d’apprentissage est généralement peu fiable et ne doit pas être prise en compte. Pour éviter cela, nous mettons en place des limites strictes aux bornes de la plage de balayage paramétrique à l’aide des expressions suivantes:
betaSpace = log10(if(betaVar> Lmax, Lmax, if(betaVar < Lmin, Lmin, betaVar)))
xArsSpace = log10(if(plas.x_wArs > Lmax, Lmax, if(plas.x_wArs < Lmin, Lmin, plas.x_wArs)))
où Lmin = 1e-6 et Lmax = 1e-3.
Sortie du DNN utilisée pour définir la constante de vitesse d’ionisation à partir de l’état fondamental en fonction de la fraction molaire d’Ars, du degré d’ionisation et de l’énergie électronique moyenne.
Application du modèle de substitution DNN au cas d’un réacteur plasma à couplage inductif
Dans ce cas particulier, les différences entre les résultats du modèle sont perceptibles mais relativement subtiles. Cela s’explique par le fait que, dans la majeure partie du plasma, le degré d’ionisation élevé tend à faire évoluer l’EEDF vers une forme maxwellienne. Les différences les plus significatives apparaissent avec la température des électrons et la densité numérique des états excités de l’argon, comme le montrent les figures ci-dessous.
Température des électrons calculée avec une EEDF maxwellienne (en bas) et avec le modèle de substitution (en haut).
Densité numérique de l’état excité de l’argon calculée avec une EEDF maxwellienne (en bas) et avec le modèle de substitution (en haut).
En utilisant une EEDF maxwellienne, l’ionisation est plus facilement maintenue, ce qui permet de maintenir la décharge à une température électronique plus basse. Cependant, dans des conditions de fonctionnement où le degré d’ionisation est faible, une hypothèse maxwellienne est susceptible de donner des résultats qui s’écartent considérablement de la réalité. Dans de tels cas, l’utilisation d’une EEDF plus précise devient essentielle pour une modélisation fiable.
Le temps de calcul pour le modèle ICP utilisant le réseau de neurones profond et un solveur temporel est d’environ 10 minutes. En revanche, la résolution de l’équation de Boltzmann dans l’approximation à deux termes, entièrement couplée au modèle de fluide plasma, prend environ une heure. Cela met en évidence l’avantage significatif de l’intégration des DNN pour introduire des effets cinétiques dans un modèle de fluide plasma. Même en tenant compte du temps nécessaire pour créer les données et entraîner le DNN, les avantages restent considérables, car le DNN peut être réutilisé dans diverses applications, ce qui dilue efficacement le coût en temps sur le long terme. Dans le modèle présenté dans cet article, nous réduisons encore les coûts de calcul en utilisant un solveur stationnaire initialisé avec les résultats du modèle résolu à l’aide de l’EEDF analytique. Cette méthode est très efficace pour les solutions en régime permanent, avec un temps de calcul de quelques secondes seulement.
Prochaine étape
Pour essayer l’exemple présenté dans cet article, cliquez sur le bouton ci-dessous. Vous serez redirigé vers la Bibliothèque d’applications, où vous pourrez télécharger le fichier MPH du modèle.
Référence
- G.J.M. Hagelaar and L.C. Pitchford, “Solving the Boltzmann equation to obtain electron transport coefficients and rate coefficients for fluid models,” Plasma Sources Science and Technology, vol. 14, pp. 722–733, 2005

Commentaires (0)