Como corrigir erros ortográficos de forma massiva e automática

Cansado de Hospedagens Lentas? Clique aqui e aprenda a usar a Digital Ocean, ganhe também 100 dólares para usar na sua hospedagem Cloud! Aprenda Como configura-la sem acessar terminais e códigos!

Neste artigo vou ensinar você a corrigir vários erros de português de uma única vez diretamente no banco de dados de seu site WordPress ou outra CMS. Tudo isso de forma automática e massiva sem a necessidade de editar página por página, artigo por artigo.

Português não é um dos meus fortes, até porque larguei o ensino médio e não fiz faculdade. Nos meus primeiros anos de website eu escrevi diversos artigos, muitos contendo erros de português extremos. Apenas com os anos eu fui capaz de identificar esses erros comuns, mas muitos artigos continuam com tais erros.

Imagina o quão chato deve ser ir manualmente artigo por artigo procurando pequenos erros de acentuação ou de palavras? Felizmente existe uma forma de corrigir todos os erros de uma só vez dentro do seu WordPress ou acessando o banco de dados de seu website.

Para fazer tais mudanças em massa utilizamos a famosa ferramenta presente em diversos editores de texto chamada search and replace que significa literalmente buscar e substituir.

Cuidados ao editar o banco de dados massivamente

Vamos ensinar a corrigir diversos erros ortográficos de português neste artigo de forma fácil e menos trabalhosa, mas vale lembrar que existem perigos em substituir diretamente palavras do banco de dados.

Pode ser que você adicione sem querer em um hiperlink algum acento, mas ele não pode conter acentuação. Se a CMS não tiver uma correção automática, isso pode quebrar o link do seu artigo. O mesmo serve para nomes de imagens e links presentes dentro dos artigos.

Por isso incentivamos sempre usar um programa que detecta links offline e erros 404 para evitar que algumas páginas do seu site morra. Lembro-me que até hoje a edição de alguns artigos ficam bugados por causa de algumas linhas de código do gutenberg que não foram excluídas no dia que tentei remover os sumários manuais dos meus artigos.

Nesse artigo incentivamos o uso de expressões regulares como (.*?) e *\?, cuidado para não substituir palavras sem intenção. Você pode acabar estragando alguns artigos em poucos cliques. Por esse motivo, se usar WordPress, recomendamos usar plugins para editar o banco de dados ao invés de fazer isso manualmente, assim você pode ver o que vai mudar antes de substituir.

Como corrigir erros ortográficos de forma massiva e automática

Corrigindo vários erros de português diretamente pelo WordPress

Ao buscar no diretório de plugins por search and replace você encontra diversos plugins que buscam diretamente no banco de dados e substitui palavras determinadas. Depois de experimentar alguns plugins eu acabei gostando do Search Regex.

Diferente dos outros plugins que edita banco de dados, nele você consegue editar apenas os artigos, ver antes de editar qualquer coisa, editar manualmente cada artigo sem abrir a página de edição dele, verificar de antemão se as alterações não vão afetar algum link ou concordância ortográfica.

Com programa aberto eu coloco a palavra que desejo substituir, como brasil escrito em letra minúscula (desativo o ignore case). Eu geralmente adiciono um espaço entre as palavras para evitar editar um link que geralmente não tem letras maiúsculas nem acentos.

Depois de ter encontrado diversos brasil escritos com letra minúscula, eu coloco novamente os espaços que adicionei e a palavra correta Brasil no campo Replace. Depois de certificar que tudo está correto, eu simplesmente clico em replace all e substituo todos os brasil em letra minúscula por Brasil com letra maiúscula.

Como corrigir erros ortográficos de forma massiva e automática

Caso pesquise por erros ortográficos raros, posso editar manualmente a fim de não causar danos aos outros artigos que usam tal palavra da maneira correta. Para isso basta clicar nos três pontinhos do artigo listado no search replace e depois clicar em inline editor.

Da para usar ambas ferramentas com diversos erros populares de português. No final deste artigo vou listar os erros comuns que cometo e no qual usei o substituidor do search regex.

Corrigindo vários erros diretamente no banco de dados

Eu não vou entrar em muitos detalhes nesse modo, mas consiste em abrir seu banco de dados em algum editor de texto ou diretamente num programa de banco de dados como phpadmin ou navicat e substituir massivamente algumas palavras no modo search and replace.

Cabe a você encontrar uma maneira de usar a ferramenta de substituição search e replace que geralmente pode ser encontrada com as teclas CTRL + F. Pode usar também editores de texto padrões como bbedit para editar diretamente os arquivos SQL e depois importa-los novamente para o site.

Lembre-se de verificar com cautela as substituições para evitar bugar seu banco de dados. Caso não tenha nenhuma experiência em manipulação de banco de dados ou ferramentas como search replace, nada que uma boa teclada no Google ajude você.

O importante é não gastar tempo editando artigo por artigo. Caso não queira arriscar, basta buscar os erros com o localizador ou busca a fim de editar manualmente no banco de dados sem a necessidade de editar página por página.

Corrigindo os Porquês e mais de forma prática

Um dos principais erros que cometia no passado era a troca de mas por mais e também o uso errado dos porquês. Existem milhares de perguntas no meu site que utilizam porque juntos ao invés de separados, a fim de corrigir isso de forma correta, na maioria das vezes preciso editar um por um ao invés de aplicar o replace all (substituir todos).

Isso porque posso acabar substituindo um porque que está correto por um errado. Principalmente em expressões como mais e mas, crases no à e outros erros onde ambas as palavras existem mas são utilizadas em situações diferentes. Nesse caso a substituição em massa não é útil além de ser perigosa, mas felizmente da para economizar tempo.

Usando o plugin Search Regex ou algum outro editor com ferramenta search and replace e de preferencia que aceite regular expressions, você pode editar diretamente vários artigos sem a necessidade de entrar página por página, mesmo que seja manualmente.

Você também pode usar algumas expressões regulares para encontrar porque em perguntas a fim de corrigir para por que. Ou você pode variar entre maiúsculo e minúsculo para encontrar tais expressões no começo de frase.

Outra coisa que eu faço é usar possíveis palavras antes ou depois da palavra errada, a fim de encontrar maneiras de corrigir sem afetar as versões que estão corretas em determinada sentença. Por exemplo, eu procuro por há alguns anos atrás a fim de remover a palavra atrás que está incorreta nessa frase.

Teste sempre possíveis palavras-chave a fim de encontrar maneiras de usar o replace all (substituir todos) sem afetar as frases que estão corretas. Basta usar um pouco a cabeça!

Como corrigir erros ortográficos de forma massiva e automática
Photo by Pixabay on Pexels.com

Principais erros de português corrigidos pelo replace

Irei adicionar diversas instruções de palavras que você pode corrigir abaixo. Vou deixar qualquer texto a ser procurado dentro de colchetes [] incluindo espaços e códigos HTML comum em formatações de texto.

Você pode corrigir erros de case (maiúscula e minúscula) desativando o ignore case e escrevendo a palavra que deseja substituir. Lembrando que geralmente palavras maísculas começam em frases, as vezes antes de um ponto com espaço [. ] ou de um código HTML de paragrafo com espaço [<p> ];

Erros simples para ser corrigidos em massa

  • errado = correto
  • duvidas = dúvidas
  • aonde = onde
  • fabricas = fábricas
  • descanço = descanso
  • auto-estima = autoestima
  • porisso = por isso
  • denovo = de novo
  • segunda feira = segunda-feira
  • apartir = a partir
  • auto-estima = autoestima
  • sombrancelha = sobrancelha
  • ajuda-lo = ajudá-lo
  • politica = política
  • comedia = comédia

Palavras que precisam ser substituídas com atenção

  • analise / análise
  • porque / por que
  • mas / mais
  • influencia / influência
  • agente / a gente
  • Em baixo / embaixo

Com tempo irei atualizar essa lista com outros erros comuns que eu lembrar. Se puder comentar outros erros, vai ajudar muito os leitores. Recomendamos erros que não existem equivalentes corretos na língua portuguesa. Dessa forma não afeta nenhuma frase correta do site.

Recentemente usando uma ferramenta descobri alguns erros do site e vou lista-los abaixo:

  • acessorio => acessório;
  • aconselhavel => aconselhável;
  • adolescencia => adolescência;
  • aerea => aérea;
  • agencia => agência;
  • agradaveis => agradáveis;
  • agradavel => agradável;
  • ajuda-lo => ajudá-lo;
  • album => álbum;
  • alcool => álcool;
  • alem => além;
  • alguem => alguém;
  • analizar => analisar;
  • aqui => aquí;
  • arco-iris => arco-íris;
  • asim => assim;
  • assasinato => assassinato;
  • assistencia => assistência;
  • atras => atrás;
  • atraves => através;
  • autenticas => autênticas;
  • autonomo => autónomo, autônomo;
  • beneficios => benefícios;
  • benção => bênção;
  • bençãos => bênçãos;
  • cabelereiro => cabeleireiro;
  • camara => câmara;
  • cambio => câmbio;
  • camera => câmera;
  • capitulo => capítulo;
  • caracteristica => característica;
  • caracteristicas => características;
  • cassar => caçar, casar, cassar;
  • catalogo => catálogo;
  • cenarios => cenários;
  • cidadães => cidadãos;
  • cientifica => científica;
  • cientifico => científico;
  • circulo => círculo;
  • classica => clássica;
  • classico => clássico;
  • classicos => clássicos;
  • comecar => começar;
  • comedia => comédia;
  • comercio => comércio;
  • construcao => construção;
  • construido => construído;
  • continou => continuou;
  • contribuiram => contribuíram;
  • crianca => criança;
  • criancas => crianças;
  • criticas => críticas;
  • criticos => críticos;
  • culinaria => culinária;
  • custume => costume;
  • decadas => décadas;
  • demonio => demónio, demônio;
  • deposito => depósito;
  • destroi => destrói;
  • destruidas => destruídas;
  • diario => diário;
  • diferencas => diferenças;
  • disponivel => disponível;
  • distribuido => distribuído;
  • disturbios => distúrbios;
  • duvidas => dúvidas;
  • economica => económica, econômica;
  • entao => então;
  • episodio => episódio;
  • especie => espécie;
  • esperanca => esperança;
  • espirito => espírito;
  • espiritos => espíritos;
  • estao => estão;
  • estreiou => estreou;
  • estudio => estúdio;
  • exelente => excelente;
  • exite => existe;
  • exitem => existem;
  • expectador => espectador;
  • extende => estende;
  • extendida => estendida;
  • facil => fácil;
  • familia => família;
  • familias => famílias;
  • fan => fã;
  • fisica => física;
  • fluído => fluido;
  • fragil => frágil;
  • galaxia => galáxia;
  • geito => jeito;
  • genero => género;
  • generos => géneros;
  • giria => gíria;
  • girias => gírias;
  • graficos => gráficos;
  • heróico => heroico;
  • historica => histórica;
  • homosexual => homossexual;
  • horario => horário;
  • houveram => houve;
  • idéia => ideia;
  • idéias => ideias;
  • imovel => imóvel;
  • importancia => importância;
  • impossivel => impossível;
  • incrivel => incrível;
  • indice => índice;
  • indices => índices;
  • individuo => indivíduo;
  • industria => indústria;
  • industrias => indústrias;
  • infancia => infância;
  • infelismente => infelizmente;
  • infra-vermelho => infravermelho;
  • ingles => inglês;
  • inicio => início;
  • inteligencia => inteligência;
  • inumeras => inúmeras;
  • inves => invés;
  • invez => invés;
  • irmao => irmão;
  • junior => júnior;
  • juz => jus;
  • lendaria => lendária;
  • leva-lo => levá-lo;
  • licensa => licença;
  • lider => líder;
  • lideres => líderes;
  • lingua => língua;
  • linguas => línguas;
  • logica => lógica;
  • luzes => luces;
  • magica => mágica;
  • meio-ambiente => meio ambiente;
  • memoria => memória;
  • menas => menos;
  • metodo => método;
  • minimo => mínimo;
  • muinto => muito;
  • munto => muito;
  • musicas => músicas;
  • mêses => meses;
  • nao => não;
  • negocios => negócios;
  • ninguem => ninguém;
  • nivel => nível;
  • numeros => números;
  • odio => ódio;
  • otima => ótima, óptima;
  • otimo => ótimo, óptimo;
  • pagina => página;
  • paises => países;
  • periodo => período;
  • personagen => personagem;
  • plastica => plástica;
  • plastico => plástico;
  • poblema => problema;
  • politicas => políticas;
  • politico => político;
  • possiveis => possíveis;
  • possivel => possível;
  • possue => possui;
  • pq => porque,porquê,por que,por quê;
  • prejuizo => prejuízo;
  • previnir => prevenir;
  • primaria => primária;
  • principio => princípio;
  • privilegio => privilégio;
  • proibe => proíbe;
  • proibem => proíbem;
  • propio => próprio;
  • proposito => propósito;
  • provincia => província;
  • proxima => próxima;
  • proximas => próximas;
  • proximos => próximos;
  • publico => público;
  • publicos => públicos;
  • quandos => quando;
  • questao => questão;
  • quimica => química;
  • quizer => quiser;
  • radio => rádio;
  • referencia => referência;
  • referencias => referências;
  • reunem => reúnem;
  • romantico => romântico;
  • saida => saída;
  • saira => saíra, sairá;
  • sao => são;
  • saudavel => saudável;
  • saude => saúde;
  • seculos => séculos;
  • sensivel => sensível;
  • serie => série;
  • serio => sério, série, seriado;
  • simbolo => símbolo;
  • simplemente => simplesmente;
  • tambem => também;
  • tao => tão;
  • tb => também;
  • tbm => também;
  • te-lo => tê-lo;
  • tecnica => técnica;
  • tendencias => tendências;
  • tijela => tigela;
  • titulo => título;
  • tres => três;
  • turistico => turístico;
  • turisticos => turísticos;
  • ultima => última;
  • unica => única;
  • unico => único;
  • usuario => usuário, utilizador;
  • util => útil;
  • varios => vários;
  • veiculo => veículo;
  • viajem => viagem;
  • violencia => violência;
  • virus => vírus;
  • vitoria => vitória;
  • voce => você;
  • vôo => voo;
  • yoga => ioga;
  • acessorios => acessórios;
  • aerosol => aerossol;
  • agricola => agrícola;
  • agricolas => agrícolas;
  • aircrafts => aircraft;
  • aki => aqui;
  • alcoolica => alcoólica;
  • algus => alguns;
  • alí => ali;
  • anuncio => anúncio;
  • area => área;
  • assasinado => assassinado;
  • assasinated => assassinated;
  • assasino => assassino;
  • atribuidos => atribuídos;
  • aviao => avião;
  • beije => bege;
  • calvice => calvície;
  • campeoes => campeões;
  • capitulos => capítulos;
  • categoria => categoría;
  • ciclano => sicrano;
  • cidadões => cidadãos;
  • cientificas => científicas;
  • cms => cm;
  • côco => coco;
  • demonios => demónios, demônios;
  • destruida => destruída;
  • destruido => destruído;
  • dia => día;
  • dias => días;
  • disponiveis => disponíveis;
  • dragao => dragão;
  • ect => etc;
  • enfase => ênfase;
  • entitulado => intitulado;
  • episodios => episódios;
  • epocas => épocas;
  • equilibrio => equilíbrio;
  • exitar => hesitar;
  • extender => estender;
  • gracas => graças;
  • guión => guion;
  • imperio => império;
  • intensão => intenção;
  • invasion => invasión;
  • juizes => juízes;
  • kilo => quilograma;
  • kilometros => quilómetros, quilômetros;
  • logista => lojista;
  • magico => mágico;
  • mecher => mexer;
  • multimedia => multimedia, multimídia;
  • multiuso => multiúso;
  • pra => para;
  • primarias => primárias;
  • producao => produção;
  • quilómetro => quilômetro;
  • reestabelecido => restabelecido;
  • reestabelecimento => restabelecimento;
  • relogio => relógio;
  • ritimo => ritmo;
  • seculo => século;
  • secundaria => secundária;
  • secundarias => secundárias;
  • simbolos => símbolos;
  • sinonimos => sinónimos;
  • sócio-culturais => socioculturais;
  • talvez => tal vez;
  • thru => through;
  • tipica => típica;
  • unicas => únicas;
  • varias => várias;
  • video => vídeo;
  • wanna => want to;