sábado, 2 de maio de 2020

O Mistério do Bilhete de Identidade e Outras Histórias. Jorge Buescu. «Esta história começa nos anos 50, com o nascimento simultâneo, por um lado, da teoria de códigos, baseada na teoria da informação de Shannon (1948), e, por outro, da cada vez maior necessidade de tratamento e transmissão…»

jdact

O mistério do bilhete de identidade
«Com grande probabilidade, o leitor terá já assistido, no meio de um jantar com amigos, à seguinte discussão. A certa altura alguém se pronuncia sobre o algarismo e/ou letras suplementar que os bilhetes de identidade/cartão de cidadão passaram a ter de há uns anos para cá mais ou menos nos seguintes termos:
O algarismo suplementar que se segue ao número do BI/Cartão de Cidadão indica o número de pessoas em Portugal que têm um nome exactamente igual ao do portador.

Quando confrontado com o absurdo de tal afirmação (por exemplo, o algarismo suplementar do meu BI é 9 e posso comprovar que sou a única pessoa no mundo, não apenas em Portugal, com o nome de Jorge Buescu), talvez o interlocutor diga algo do género mas fui informado por fonte seguríssima de que é assim. Ou talvez prefira mudar de assunto. Uma coisa é certa: não vai mudar de opinião e na próxima vez que se falar do assunto lá estará a repetir a mesma afirmação, que depois será eventualmente repetida por novos crentes acríticos, e assim sucessivamente. Assistimos, assim, à geração e propagação oral de uma lenda urbana genuinamente portuguesa, com certeza. Afinal de contas, o que representa o misterioso algarismo suplementar que se segue ao número do nosso BI/CC? Em primeiro lugar, não representa o número de pessoas com o mesmo nome, ou o número de multas de estacionamento que o portador apanhou (como também circula), ou qualquer outra patética e disparatada hipótese deste tipo. O algarismo suplementar é (ou seria, se as autoridades portuguesas não tivessem cometido um ridículo erro matemático!) apenas um algarismo de controlo que detecta se o número do BI/CC está correctamente escrito ou não.
Esta história começa nos anos 50, com o nascimento simultâneo, por um lado, da teoria de códigos, baseada na teoria da informação de Shannon (1948), e, por outro, da cada vez maior necessidade de tratamento e transmissão em massa de dados de identificação numéricos. Suponha o leitor que é, por exemplo, caixa num supermercado na era pré-leitores ópticos, ou que trabalha numa agência de viagens onde tem de emitir centenas de bilhetes de avião por dia, ou que trabalha numa livraria onde tem de expedir por correio centenas de livros encomendados por dia. Em qualquer destes casos será obrigado a digitar para cada item em questão (pacote de manteiga, bilhete de avião ou livro) um longo número, talvez com 10 algarismos, que identifica o produto em questão. E tem de fazê-lo depressa para que os outros clientes na bicha não se impacientem.
Os seres humanos lidam claramente mal com problemas deste tipo. Escrever diariamente centenas de números com 10 algarismos sem qualquer padrão aparente leva inevitavelmente (uma interrupção, uma piada do colega do lado...) a que o operador, mais tarde ou mais cedo, se engane a escrever um dos números. E as consequências podem ser bastantes desagradáveis: cobrar 20 contos por um pacote de manteiga, emitir um bilhete de avião para a Sibéria, em vez de para o Rio, expedir o livro errado. Os custos para corrigir estes erros a posteriori podem, evidentemente, ser muito elevados. Coloca-se então o seguinte problema: quando se lida sistematicamente com grandes quantidades de números compridos, em que mais tarde ou mais cedo se verificarão erros, há que identificar quais são os erros mais frequentes e encontrar uma forma automática de detectar, logo que o número é escrito, se integra erros ou não.
A resposta à primeira pergunta é do domínio da estatística; sabe-se hoje que mais de 90% dos erros ocorridos na transmissão de dados numéricos são de dois tipos:

erros singulares (alteração de um único algarismo, o que levaria, por exemplo, 2357 a ser escrito como 2358) ou transposições (troca de pares de algarismos adjacentes, como na passagem de 2357 a 2375);
O segundo passo é conceber um algoritmo que detecte, com 100% de eficiência, a presença ou ausência destes erros. Se o conseguirmos teremos um mecanismo de detecção de erros com eficiência superior a 90%.»

In Jorge Buescu, O Mistério do Bilhete de Identidade e Outras Histórias, 2001, Colecção Ciência Aberta, Gradiva, 2005, ISBN 972-662-792-3.

Cortesia de Gradiva/JDACT