Linux
em aplicações científicas
O
Professor João Meidanis é coordenador do Laboratório
de Bioinformática da Unicamp. Matemático e PhD em computação
pela Universidade de Winsconsin, João Meidanis tem se dedicado
à programação em linguagem Perl em plataformas
Linux, para fins científicos. O Laboratório
de Bioinformática do Instituto de Computação
é responsável pelo tratamento de dados de sequenciamento
enviados pelos vários laboratórios financiados pela Fapesp
na área de genômica.
|
João
Meidanis e João Setúbal - coordenadores do Laboratório
de Bioinformática da Unicamp
|
Com
Ciência - O sr. e seu grupo pretendem patentear as ferramentas de software
desenvolvidas no âmbito do projeto Genoma Fapesp? Como fica esta decisão
perante a política da Fapesp de propriedade intelectual?
João Meidanis - Esta foi uma discussão que tivemos desde o início
do nosso envolvimento com os projetos Genoma. A maioria de nós tende
a pensar nas ferramentas que desenvolvemos como sofware livre. Colocamos
um cabeçalho que indica essa orientação nossa nos programas que
instalamos em outros laboratórios. Mas uma política formal ainda não
foi decidida pelos membros do nosso grupo. Não sei como a Unicamp e
a Fapesp vêem isso.
Com
Ciência - O fato de utilizarem o Linux para programação implicaria em
alguma restrição para o patenteamento dos softwares desenvolvidos pelo
seu grupo?
Meidanis - Não creio. Em primeiro lugar, não usamos apenas Linux.
Apenas como informação, posso dizer que você pode desenvolver um programa
em Linux, usando editores, compiladores do Linux e cobrar pelo seu sofware
depois. O que não pode é incluir algum algum código livre no seu software
e aí cobrar (na verdade, parece que há excessões para bibliotecas).
Nossos programas são em sua maioria escritos pelo Perl, que usa um sistema
de copyright um pouco diferente do Linux, chamado Artistic License.
Mas mesmo assim poderíamos patentear ou cobrar pelo software. Porém,
não achamos que é o melhor caminho para nós neste momento.
Com
Ciência - Porque foi feita a escolha do Linux?
Meidanis - Bom, Linux é bom e barato (de graça). Contudo, não usamos
apenas o Linux. Vários de nossos computadores rodam Windows ou outros
sistemas da família Unix que são proprietários. Se bem que hoje me parece
que hoje só temos uma máquina Windows.
Com
Ciência - As estratégias de sequenciamento (programação de dados) são
as mesmas nos vários projetos genoma internacionais?
Meidanis - Não. Existem vários programas para o que chamamos de
"montagem de fragmentos", que é a tarefa número um num projeto genoma.
Alguns pagos, outros de graça; alguns vêm com o código fonte, outros
não. Cada projeto escolhe uma ferramenta entre as existentes e a usa.
Em alguns casos, o grupo tem que desenvolver sua própria ferramenta,
como fez a Celera, pois não havia similar no mercado, nem pagando. Um
projeto genoma pode ser resumido em sequenciar, montar e anotar. Sequenciar
é no laboratório; sobre montar falei acima. Quanto a anotar, aqui também
há várias ferramentas. Uma característica dos projetos genoma brasileiros
é a distribuição geográfica dos participantes, o que nos obrigou a construir
ferramentas de anotação distribuída, operando pela web. Creio que não
existem similares em outro lugar do mundo.
Com Ciência - Como funciona o compartilhamento dos dados?
Meidanis - Nossos sistemas são feitos de modo que apenas os participantes
de cada projeto tenha acesso aos dados, tanto para vê-los quanto para
acrescentar mais dados, ou retirar dados errôneos. Apesar após a publicação
principal de um projeto é que os dados são liberados, como aconteceu
com a bactéria Xylella fastidiosa. Em breve, deveremos liberar
também os dados da cana de açúcar e da bactéria Xanthomonas axonopodis
pv citri, quando saírem as publicações principais destes projetos.
Com
Ciência - As ferramentas usadas pelo seu grupo nos vários projetos Genoma
Fapesp poderiam ser usadas nos projetos Proteomas?
Meidanis - Acredito que parte das ferramentas de anotação seria
útil num projeto proteoma, mas creio que mais programas seriam necessários.
Com
Ciência - Como é articulada a Bioinformática nacional em relação aos
vários projetos genoma? Como são alocados os recursos financeiros e
investimentos em equipamentos e pessoal especializado neste momento?
Seria semelhante ao relatado a nove meses atrás na reportagem "Projeto
Genoma" realizada pela Com Ciência?
Meidanis - A bioinformática vem crescendo no país, acompanhando
o crescimento e proliferação dos projetos genoma. Ao lado do nosso laboratório,
o LBI - Laboratório de Bio Informática aqui na Unicamp, estão surgindo
grupos na USP, no Instituto Ludwig, em Ribeirão Preto e no Rio de Janeiro.
Em Pernambuco há uma iniciativa também. A grande maioria dos recursos
se destina à compra de equipamentos, por restrições das próprias agências
de fomento. O prof. Perez, da Fapesp, uma vez comentou que o perfil
das necessidades do pesquisador mudou. Há algum tempo atrás, o maior
problema era a falta de equipamento. Hoje o maior problema é a falta
de pessoal técnico. Na Bioinformática é exatamente isto que ocorre.
Ainda com um agravante: os bons profissionais são atraídos fortemente
pelas empresas privadas. É uma situação que vai levar tempo para se
resolver.