Se connecter avec
S'enregistrer | Connectez-vous

C++ chercher et mémoriser lien_web à l’intérieur d’une balise Html

Dernière réponse : dans Programmation

Bonsoir, je vous explique mon problème : je travaille en C++, je dois ouvrir un fichier html, ensuite lire ligne par ligne et repérer toutes les balises <a href= “adresse_web” > . J’ai besoin de mémoriser (éventuellement en créant un autre fichier avec ofstrem) les différentes "adresse_web" pour pouvoir les réutiliser plus loin dans le programme.
J’arrive sans problème a ouvrir la page html, à lire ligne par ligne cette même page ( j’utilise ifstream et getline), mais je ne sais pas comment mémorise le lien. Comment faire ? merci de votre aide
Lassé par la pub ? Créez un compte
Expert Programmation

1. Il ne faut pas faire une analyse ligne par ligne mais tag par tag, récursivement ou en utilisant une pile.
2. Il faut ensuite faire une analyse de tous les attributs (clé, valeur).
3. Après avoir fait ça, trouver tous les tag "a" et récupérer la valeur dont la clé et "href" devient très simple.

Merci pour votre réponse et excusez moi pour le retard.
J’ai peur de n’être pas assez compétent en C++ pour comprendre votre solution. Pourriez vous me montez
un exemple de code ?
Pour l’instant j’ai résolu le problème, en utilisant une série de conditions if , c'est-à-dire : pour chaque ligne que je lis, SI je rencontre le premier caractère, più le deuxième , più le troisième, etc., je copie le lien, jusqu’au caractère ‘ ”’. cette solution marche, mais je suis sure qu’on peut faire plus simple.
Lassé par la pub ? Créez un compte
Tom's guide dans le monde