Dans le contexte de la caractérisation précoce des tumeurs du sein, il est intéressant de combiner les modalités électromagnétiques (EM) et ultrasonores (US), car elles sont toutes deux non ionisantes et peu coûteuses, et offrent des caractéristiques de résolution complémentaires. Nous proposons ici une nouvelle structure de réseau neuronal convolutif (CNN), appelée réseau neuronal complexe en cascade tenant compte de la structure (SACC-CNN). Il se compose de deux parties, le réseau de reconstruction (SARNet) et le réseau de classification (SACNet). Le SACNet produit la carte des types de tissus qui est ensuite transmise au SARNet, qui reconstruit les paramètres EM et US. Ces deux parties peuvent être considérées comme deux modules indépendants. Une fonction de perte guidée par la physique est mise en oeuvre dans le réseau SARNet pour améliorer la similarité structurelle. Les principales caractéristiques de ces approches, illustrées par des simulations, sont décrites.