Seminarium Advanced BioComputing
voortaan
Seminarium Computational Molecular Biology
Hendrik Jan Hoogeboom
en
Walter Kosters
begeleidden in het voorjaar van 2002
een Seminarium
Advanced
BioComputing.
Het seminarium wordt in het
voorjaar van 2003 's avonds
door
*
onder een nieuwe titel gegeven.
Het vak levert 5 studiepunten op.
Roostering:
voorjaar 2002: Vrijdag van 11.15 tot 13.00 uur in zaal 401
(op 12 april in zaal 405).
Data: 18 januari 2002 (voorbespreking), 25 januari (afspraken),
15 februari tot en met 22 maart,
12 april tot en met 26 april.
Aanmelden vooraf bij de docent(en).
Inhoud
Met het ontwarren van de DNA code komt een grote hoeveelheid
data beschikbaar. Voor de verwerking van deze gegevens is het
gebruik van computers onontbeerlijk. Het vakgebied van de
"computational biology" of "bioinformatics" ontwikkelt de
benodigde gereedschappen: complexe databases, geavanceerde
zoektechnieken, maar vooral efficiente algoritmen toegesneden
op het vergelijken en samenpassen van strings.
Het Seminarium ABC beoogt een aantal representatieve
algoritmen te bestuderen aan de hand van recente literatuur.
In eerste instantie kunnen de deelnemers kiezen uit de volgende onderwerpen,
alle refererende naar een hoofdstuk uit het ondervermelde boek
van Pavel Pevzner.
- Restriction mapping (Hoofdstuk 2)
Knip string op twee/drie manieren (A, B en ook
nog via A én B) aan stukken en probeer
de originele volgorde terug te vinden.
- Map assembly (Hoofdstuk 3)
Vind de kortste string die een gegeven aantal strings "overdekt",
dat wil zeggen
als deelstring bevat, waarbij de deelstring intern
een andere volgorde mag hebben.
- DNA-arrays (Hoofdstuk 5)
Van alle strings met k letters weet je of deze al of niet
in een gegeven string voorkomen; hoe deze te reconstrueren?
- Sequence comparison (Hoofdstuk 6)
Hoe kun je de ene string in de andere veranderen, met zo weinig
mogelijk werk? Hoe lijken ze op elkaar?
- Multiple alignment (Hoofdstuk 7)
Leg aantal strings, eventueel aangevuld met spaties, onder elkaar
zodat de kolommen zo "goed" mogelijk zijn.
- Finding signals in DNA (Hoofdstuk 8)
Welke deelstrings vallen op, positief of negatief?
- Genome rearrangements (Hoofdstuk 7 van Setubal & Meidanis;
of Pevzner Hoofdstuk 10)
Van kool naar raap: 1,-5,4,-3,-2 (klap -2 om) 1,-5,4,-3,2
(klap 4 om) 1,-5,-4,-3,-2 (klap -5,-4,-3,-2 om) 1,2,3,4,5.
- All about Eve (Hoofdstuk 4 van Clote & Backofen)
Hoe zit het met onze evolutionaire stamboom?
- Structure prediction (Hoofdstuk 6 van Clote & Backofen)
Ruimtelijke structuur van RNA.
Deelnemers
In het voorjaar van 2002 hebben meegedaan:
Jan-Willem van den Berg | mvdberg @ liacs.nl |
Robert Brijder | rbrijder @ liacs.nl |
Evert-Jan de Bruin | edebruin @ liacs.nl |
Julia Dmitrieva | j.dmitrieva @ umail.leidenuniv.nl |
Bas Groenendijk | bgroenen @ liacs.nl |
Peter Koning | peter @ gelooft.nl |
Shlomo Raikin | sraikin @ liacs.nl |
William Rossie | wrossie @ hetnet.nl |
| |
Rooster
Het rooster in het voorjaar van 2002 was als volgt:
Datum |
Onderwerp |
Beurt |
18.01.02 |
inleiding |
Walter & Hendrik Jan |
25.01.02 |
verdelen beurten |
15.02.02 |
Restriction mapping |
Evert-Jan & Robert |
22.02.02 |
verdeling verdere beurten |
|
01.03.02 |
Map assembly |
William & Julia |
08.03.02 |
DNA-arrays |
Jan-Willem & Bas |
15.03.02 |
Sequence comparison |
Peter & Shlomo |
22.03.02 |
Finding signals & Multiple alignment |
Jan-Willem & William |
12.04.02 |
Genome rearrangements |
Peter & Robert |
19.04.02 |
All about Eve |
Shlomo & Evert-Jan |
26.04.02 |
Structure prediction |
Bas & Julia |
Vorm
Elk onderwerp wordt in één bijeenkomst
van twee uur behandeld, door een team van twee deelnemers.
Iedereen komt twee keer aan bod;
voor het tweede onderwerp worden andere tweetallen
gevormd. Verwacht wordt:
- Voorbespreking voordracht met docenten;
onder meer de eerste versie van de sheets wordt doorgenomen;
circa één week voor de voordracht.
- Voordracht. Denk hierbij ook aan de biologische achtergrond.
- Actieve deelname bij voordracht van andere koppels.
- Nabespreking voordracht met docenten.
- Schriftelijke verslaglegging in een
LaTeX-document
van ongeveer 10 pagina's, in het Nederlands. (Dus 5 plus 5 pagina's
voor de totale voordracht.)
- Individueel: samenvatting van alle voordrachten van de andere koppels,
van steeds 1 pagina (met de standaardinstellingen van LaTeX)
per onderwerp, in het Nederlands.
Voor de tweede serie voordrachten:
meld per spreker iets goeds, en iets wat beter zou kunnen;
probeer in één zin de essentie van het betoog te geven.
Literatuur
Een selectie uit:
- Pierre Baldi and Søren Brunak,
Bioinformatics: The Machine Learning Approach,
MIT Press, 1998
- Peter Clote»
and Rolf Backofen,
Computational Molecular Biology: An Introduction,
Wiley, 2000
- Richard Durbin, Sean Eddy, Anders Krogh and Graeme Mitchison,
Biological Sequence Analysis:
Probabilistic Models of Proteins and Nucleic Acids,
Cambridge University Press, 1998
- Olivier Gascuel and Bernard M.E. Moret, editors,
Algorithms in Bioinformatics, Proceedings WABI,
Springer LNCS 2149, 2001
- Cynthia Gibas»
and Per Jambeck,
Developing Bioinformatics Computer Skills,
O'Reilly, 2001
- Dan Gusfield,
Algorithms on Strings, Trees, and Sequences,
Cambridge University Press, 1997
- Pavel A. Pevzner»,
Computational Molecular Biology,
An Algorithmic Approach,
The MIT Press, 2000 [met name deze]
- João Setubal and João Meidanis,
Introduction to Computational Molecular Biology,
PWS Publishing Company, 1997
Vragen en/of opmerkingen kunnen worden gestuurd
naar: kosters@liacs.nl.
26 april 2002 - http://www.liacs.nl/home/kosters/semabc.html