separar tags html do conteudo

1. separar tags html do conteudo

shoujo
shoujo

(usa Slackware)

Enviado em 23/03/2017 - 09:17h

Olá, estou escrevendo um tradutor, já esta funcionando traduzir textos em um site que eu mesma crie...
Porém quero usar esse recurso em outros sites.. tipo o google tradutor.
Como eu faço para separar as tags do conteudo do site?
por exemplo
<html><head></head><body>Conteudo 1 <a href="url">site aqui</a> ......

entao quero que ele converta apenas os conteudos das tags, mas nao mecha nos parametros delas. por exemplo, classes, etc.
Alguem faz ideia de como fazer isso?


  


2. Re: separar tags html do conteudo

Luiz Santos
luiztux

(usa Gentoo)

Enviado em 23/03/2017 - 10:46h

innerHTML?

https://www.w3schools.com/jsref/prop_html_innerhtml.asp

-----------------------------------''----------------------------------

Larry, The Cow, uses Gentoo GNU/Linux

^__^
(oo)
(__)

"If it moves, compile it."




3. Re: separar tags html do conteudo

shoujo
shoujo

(usa Slackware)

Enviado em 23/03/2017 - 11:03h

nao... acho que vc nao entendeu minha duvida.
eu vou capturar o codigo inteiro de uma pagina via jquery, e esse valor vai ser gravado em uma string, nele vai ter toda a estrutura html do site, o body, o css, o javascript, e um monte de tags e tags dento de tags, inclusive tags sem id por exemplo..
o que preciso é criar um detector de conteudo que separe as tags ou seja o conteudo invisivel, do conteudo visivel do site, e arranje esses valores em um array
por exemplo
<body><div><div id="div1">conteudo</div></div></body>
quero que esse texto seja dividido de modo que um array fique assim
array[0]="<body>";
array[1]="<div>";
e assim sucessivamente ele vai colocar cada tag ou conteudo como elemento do array
depois eu faço um laço for e detecto se o primeiro caractere for igual a < entao é uma tag eu nao faco nada, caso contrario ele é um conteudo entao esse elemento vai ser convertido pra nova linguagem.


ou se tiver uma ideia melhor de como fazer isso.


4. Re: separar tags html do conteudo

Luiz Santos
luiztux

(usa Gentoo)

Enviado em 23/03/2017 - 11:16h

shoujo escreveu:

(...)o que preciso é criar um detector de conteudo que separe as tags ou seja o conteudo invisivel, do conteudo visivel do site, e arranje esses valores em um array
por exemplo(...)


Já que vai usar JQuery, que tal os seletores?

https://www.w3schools.com/jquery/jquery_ref_selectors.asp

Assim você vai conseguir filtrar tudo isto...

-----------------------------------''----------------------------------

Larry, The Cow, uses Gentoo GNU/Linux

^__^
(oo)
(__)

"If it moves, compile it."




5. Re: separar tags html do conteudo

shoujo
shoujo

(usa Slackware)

Enviado em 23/03/2017 - 12:49h

Meu maior problema é que o conteudo é dinâmico, eu não sei o que vem pela frente.
Mas se a google fez o google tradutor, é porque isso é possivel de ser feito, agora como será que eles fazem? :(






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts