Texto Purificar API

A API Text Purify extrai texto limpo de páginas da web removendo anúncios e conteúdo irrelevante facilitando a leitura e o processamento automatizados
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Sobre a API:  

A API Text Purify foi projetada para transformar a forma como você interage com o conteúdo da web, proporcionando uma solução robusta e eficiente para extrair texto relevante de artigos e páginas da web. Em um mundo saturado de informações, essa API se torna uma ferramenta essencial para os usuários que buscam obter dados limpos e significativos, sem a bagunça de anúncios, menus e outros elementos indesejados.
A API Text Purify é um serviço baseado na nuvem que permite aos usuários extrair o conteúdo principal de artigos da web com alta precisão. Esta API é ideal para aplicações que requerem a coleta e análise de conteúdo de notícias, blogs, pesquisas e mais. Ela utiliza técnicas avançadas de processamento de linguagem natural (NLP) e aprendizado de máquina para identificar e extrair texto relevante, garantindo que apenas informações valiosas sejam entregues ao usuário. A API está equipada com algoritmos sofisticados que reconhecem e extraem o texto principal de uma página da web. Isso inclui identificar o texto principal dos artigos e excluir automaticamente anúncios, menus, barras laterais e outros elementos não essenciais.

Ela pode lidar com uma ampla variedade de formatos e estilos de layout de páginas da web, garantindo que a extração de conteúdo seja eficaz, independentemente do design do site. A API foi projetada para funcionar com conteúdo em diferentes idiomas, tornando-a versátil para aplicações globais. Uma interface de programação de aplicativos (API) simples e bem documentada é fornecida, facilitando a integração com suas aplicações e fluxos de trabalho existentes. A API fornece respostas rápidas, o que é crucial para aplicações em tempo real e análise de dados em grande escala. Isso permite uma experiência do usuário suave e eficiente.

 

O que esta API recebe e o que sua API fornece (entrada / saída)?

A API Text Purify recebe uma URL e configurações opcionais e fornece texto limpo do artigo, excluindo anúncios, junto com metadados como título e autor.

 

Quais são os casos de uso mais comuns dessa API?

  1. Usa a API para extrair o texto principal de artigos de várias fontes de notícias e apresentá-los em uma plataforma unificada, melhorando a experiência do usuário ao evitar anúncios e conteúdo irrelevante.

    Facilita a coleta de informações de artigos acadêmicos e de pesquisa, permitindo que os pesquisadores extraiam o conteúdo essencial para análise e revisão sem as distrações da publicidade.

    Criar aplicações que gerem resumos concisos de artigos da web, extraindo apenas o conteúdo principal e relevante, oferecendo aos usuários versões mais digeríveis de textos longos.

    Permite que curadores de conteúdo extraiam e apresentem apenas o texto mais relevante de artigos e publicações, garantindo que seus públicos recebam informações de alta qualidade, sem elementos dispersivos.

    Extrai conteúdo relevante de avaliações e artigos online para realizar análises de sentimento, ajudando empresas a entenderem melhor a percepção pública de seus produtos ou serviços.

     

Existem limitações nos seus planos?

Plano Básico: 50 requisições por minuto.

Plano Pro: 100 requisições por minuto.

Plano Pro Plus: 240 requisições por minuto.

Plano Premium: 360 requisições por minuto.

Documentação da API

Endpoints


Para usar este endpoint, forneça a URL do artigo para extrair seu conteúdo principal, removendo anúncios e elementos não relevantes.

 

word_per_minute (opcional): este parâmetro influencia o cálculo do "tempo de leitura". Por padrão, está definido para 300 palavras por minuto. Ajuste este valor conforme necessário para corresponder à sua estimativa desejada de velocidade de leitura

desc_truncate_len (opcional): controla o comprimento máximo da descrição gerada. O padrão é 210 caracteres. Se a descrição extraída exceder esse limite, ela será truncada para garantir concisão

desc_len_min (opcional): define a contagem mínima de caracteres necessária para a descrição. O padrão é 180 caracteres. Se a descrição extraída ficar abaixo desse limite, a API retornará "nulo"

content_len_min (opcional): define o requisito de contagem mínima de caracteres para o conteúdo extraído. O padrão é 200 caracteres. Se o conteúdo ficar abaixo desse mínimo, a API retornará "nulo"



                                                                            
GET https://pr137-testing.zylalabs.com/api/4949/text+purify+api/6229/article+extract
                                                                            
                                                                        

Extração do Artigo - Recursos do endpoint

Objeto Descrição
url [Obrigatório]
word_per_minute Opcional
desc_truncate_len Opcional
desc_len_min Opcional
content_len_min Opcional
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://ellzey.house.gov/2024/10/congressman-jake-ellzey-s-statement-on-fema-aid","title":"Congressman Jake Ellzey's Statement on FEMA Aid","description":"The Department of Homeland Security, under Secretary Mayorkas, has taken actions that make illegal immigration more attractive by reallocating funds that should be prioritized for disaster relief efforts. At...","links":["https://ellzey.house.gov/2024/10/congressman-jake-ellzey-s-statement-on-fema-aid"],"image":"https://ellzey.house.gov/vendor/_accounts/jakeellzey/_skins/062422/images/social_card.png","content":"<div>\n<article>\n<a></a>\n<div><p>The Department of Homeland Security, under Secretary Mayorkas, has taken actions that make illegal immigration more attractive by reallocating funds that should be prioritized for disaster relief efforts. At a time when FEMA is warning that they do not have enough funding to cover the rest of the hurricane season, money has been funneled into programs that provide aid to noncitizen migrants.</p>\r\n<p>Over $1 billion has been directed to programs like the Shelter and Services Program (SSP) and the Emergency Food and Shelter Program, which have been repurposed to support illegal immigrants. With 150,000 households already relying on FEMA aid after devastating hurricanes, this is a gross misallocation of resources.</p>\r\n<p>The current Administration needs to stop diverting taxpayer money to initiatives that encourage illegal immigration and instead focus on supporting the American people and their immediate needs during natural disasters.</p>\r\n<p>Here is what we know: </p>\r\n<ul>\r\n<li>Homeland Security Secretary Alejandro Mayorkas said Federal Emergency Management Agency (FEMA) can meet immediate needs but does not have enough funds for the rest of Hurricane season.</li>\r\n<ul>\r\n<li>Congress recently granted $20 Billion for FEMA’s disaster relief fund as part of the September continuing resolution.</li>\r\n<li>The Biden Administration has granted North Carolina additional aid in the recovery effort with a 100 percent federal cost share for debris removal and emergency protective measures for six months.</li>\r\n<li>150,000 households have registered for FEMA aid.</li>\r\n</ul>\r\n<li>The Shelter and Services Program (SSP) administered by FEMA provides financial support to non-federal agencies to provide humanitarian services to “noncitizen migrants.”</li>\r\n<ul>\r\n<li>FEMA, on their website, said they have funneled at least $1 billion into the program between FY23 and FY24.</li>\r\n<li>New York City’s Department of Homeless Services has given $4,000 in grants to 150 families to help illegal immigrants settle into permanent homes.</li>\r\n<li>The Emergency Food and Shelter Program, also under FEMA, was repurposed into a fund for Illegal immigrants. Many of these funds went to Catholic Charities on the border, totaling $13,937,331 in 2023.</li>\r\n</ul>\r\n</ul>\r\n<ul>\r\n<li>Secretary Mayorkas’ response is that SSP is a separate appropriated account from disaster relief and is not associated with those funding streams.</li>\r\n<ul>\r\n<li>On FEMA’s website, they claim, “No money is being diverted from disaster response needs. FEMA’s disaster response efforts and individual assistance are funded through the Disaster Relief Fund, which is a dedicated fund for disaster efforts. Disaster Relief Fund money has not been diverted to other, non-disaster related efforts.”</li>\r\n<li>The December 2022 consolidated funding bill authorizing the split-off program for spending on migrants vaguely described the purpose as for “providing shelter and other services to families and individuals encountered by the Department of Homeland Security.”</li>\r\n</ul>\r\n</ul>\n<p>######</p></div>\n</article>\n</div>","author":"@RepEllzey","favicon":"https://ellzey.house.gov/vendor/_accounts/jakeellzey/_skins/062422/images/favicon.ico","source":"ellzey.house.gov","published":"2024-10-07T04:00:00Z","ttr":86,"type":"article"}}
                                                                                                                                                                                                                    
                                                                                                    

Extração do Artigo - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/4949/text+purify+api/6229/article+extract?url=https://css-tricks.com/empathetic-animation/&word_per_minute=300&desc_truncate_len=210&desc_len_min=180&content_len_min=200' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Para usar este endpoint, ele fornece a URL do artigo para extrair seu conteúdo principal através de um proxy, facilitando a extração de sites com restrições de acesso

Este endpoint adicional pode ser útil para extrair artigos de websites que restringem o acesso com base na geografia do usuário ou na sessão

Quando você chama este endpoint, o mecanismo de extração selecionará aleatoriamente um agente proxy do nosso pool, e então tentará carregar a página da web alvo através do proxy escolhido

Devido à natureza dos servidores proxy, os tempos de carregamento podem variar dependendo da localização e desempenho do proxy selecionado

 



                                                                            
GET https://pr137-testing.zylalabs.com/api/4949/text+purify+api/6230/article+proxy+extract
                                                                            
                                                                        

Extração de Proxy de Artigo - Recursos do endpoint

Objeto Descrição
url [Obrigatório]
word_per_minute Opcional
desc_truncate_len Opcional
desc_len_min Opcional
content_len_min Opcional
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/","title":"Fidelity's Ethereum spot ETF listed on DTCC under ticker $FETH","description":"Fidelity's spot Ethereum fund is now listed on DTCC under ticker $FETH following SEC's approval of multiple Ethereum ETFs.","links":["https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/"],"image":"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-800x457.jpg","content":"<div>\n            <section>\n            <h2>SEC's approval process for Ethereum ETFs underway, trading awaits S-1 filings.</h2>\n        </section>\n            <section>\n            <picture>\n                <source media=\"(min-width: 850px)\" srcset=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-800x457.jpg\"></source>\n                <img src=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-400x228.jpg\" alt=\"Fidelity's spot Ethereum ETF listed on DTCC under ticker $FETH\" title=\"Fidelity’s spot Ethereum ETF listed on DTCC under ticker $FETH\" />\n            </picture>\n        </section>\n    <section>\n        <p>Fidelity’s Ethereum spot ETF has been listed on the Depository Trust and Clearing Corporation (DTCC) under the ticker symbol $FETH. This development comes on the heels of the US Securities and Exchange Commission’s (SEC) <a href=\"https://cryptobriefing.com/sec-ethereum-etf-approval/\" target=\"_blank\">approval of spot Ethereum exchange-traded funds</a> (ETFs) on May 23.</p><figure><img src=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29225708/Fidelity-Ethereum-ETF-on-DTCC.jpg\" /><figcaption>Fidelity’s Ethereum spot ETF is now listed on <a href=\"https://www.dtcc.com/products/cs/exchange_traded_funds_plain_new.php\" target=\"_blank\">DTCC</a></figcaption></figure><p>BlackRock’s Ethereum fund, iShares Ethereum Trust, is listed on the DTCC <a href=\"https://cryptobriefing.com/blackrock-ethereum-etf-dtcc/\" target=\"_blank\">under ticker $ETHA</a>. VanEck’s Ethereum ETF is listed <a href=\"https://cryptobriefing.com/vaneck-dtcc-ethereum-etf-listing/\" target=\"_blank\">under ticker $ETHV</a> and Franklin Templeton’s <a href=\"https://cryptobriefing.com/franklin-templeton-ethereum-etf-dtcc-listing/\" target=\"_blank\">under ticker $EZET</a>.</p><p>The SEC’s acceptance of the 19b-4 forms for the spot Ethereum ETFs marks a major step, although the commencement of trading awaits the approval of each ETF’s S-1 filing.</p><p>Discussions between the SEC and ETF issuers about the S-1 forms are reportedly <a href=\"https://cryptobriefing.com/sec-engages-ethereum-etf-issuers-s-1-forms/\" target=\"_blank\">underway</a>. However, the timeframe for the trading approval is uncertain, with projections ranging from weeks to months.</p><p>VanEck was among the first to submit an amended S-1 form on May 23, with BlackRock following suit with an <a href=\"https://cryptobriefing.com/blackrock-ethereum-etf-launch/\" target=\"_blank\">updated S-1 filing</a> today. The S-1 form serves as an initial registration document that must be filed with the SEC before a security can be offered to the public.</p>\n                                </section>\n    <section>\n                    <a href=\"https://cryptobriefing.com/disclaimer/\" target=\"_blank\">\n                Disclaimer            </a>\n    </section>\n</div>","author":"@crypto_briefing","favicon":"https://static.cryptobriefing.com/wp-content/uploads/2020/02/02093517/ios-144.png","source":"cryptobriefing.com","published":"2024-05-30T17:14:47+00:00","ttr":40,"type":"article"}}
                                                                                                                                                                                                                    
                                                                                                    

Extração de Proxy de Artigo - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/4949/text+purify+api/6230/article+proxy+extract?url=https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/&word_per_minute=300&desc_truncate_len=210&desc_len_min=180&content_len_min=200' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Texto Purificar API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

Texto Purificar API FAQs

Use a API fornecendo uma URL para extrair o conteúdo principal do artigo Defina parâmetros opcionais para personalizar a extração e a formatação

A API Text Purify limpa e extrai texto relevante de páginas da web removendo anúncios e conteúdo indesejado fornecendo apenas o texto principal do artigo

Existem diferentes planos que atendem a todos incluindo um teste gratuito para um pequeno número de solicitações mas sua taxa é limitada para prevenir abusos do serviço

Zyla oferece uma ampla gama de métodos de integração para quase todas as linguagens de programação Você pode usar esses códigos para integrar ao seu projeto conforme necessário

A API retorna informações detalhadas sobre a idade e a história de um domínio, incluindo anos, meses e dias desde sua criação, bem como datas de expiração e atualização

O endpoint GET Article Extract retorna o conteúdo principal de um artigo incluindo o título a descrição o conteúdo e metadados como a URL e a imagem O endpoint GET Article Proxy Extract fornece dados semelhantes mas através de um proxy para sites restritos

Os campos-chave na resposta incluem "url" (o link do artigo), "title" (o título do artigo), "description" (um breve resumo), "content" (o texto principal) e "image" (uma URL de imagem relevante)

Os dados de resposta estão estruturados em formato JSON com um campo "error" indicando sucesso ou falha um campo "message" para atualizações de status e um objeto "data" contendo os detalhes do artigo extraído

Os parâmetros incluem "palavras_por_minuto" para velocidade de leitura "desc_truncate_len" para comprimento máximo da descrição "desc_len_min" para comprimento mínimo da descrição e "content_len_min" para comprimento mínimo do conteúdo

Os usuários podem personalizar solicitações ajustando parâmetros opcionais para controlar a velocidade de leitura o comprimento da descrição e o comprimento do conteúdo permitindo uma saída personalizada com base em necessidades específicas

Cada ponto de extremidade fornece o texto principal do artigo título descrição imagem e links permitindo que os usuários acessem conteúdo abrangente sem anúncios ou elementos irrelevantes

A precisão dos dados é mantida através de técnicas avançadas de processamento de linguagem natural e aprendizado de máquina que identificam e extraem conteúdo relevante enquanto filtram anúncios e elementos não essenciais

Casos de uso típicos incluem curadoria de conteúdo pesquisa acadêmica análise de sentimentos e criação de resumos de artigos permitindo que os usuários se concentrem em informações essenciais sem distrações

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas


Você também pode gostar