Wissenslogs Bierologie

Meine Bachelor-Arbeit: Transkriptom-Analysen für jeden?

Bastian Greshake | 11. August 2010, 17:47

Heutzutage sequenzieren Biologen ja fast alles. Gemeint ist dabei das lesbar machen der genetischen Informationen. Aus den chemischen Bausteinen werden dabei dann lustige Buchstabenfolgen die aus den Anfangsbuchstaben der vier Basen (Adenin (A) oder Guanin (G), Thymin (T) und Cytosin (C)) bestehen die bequem am Computer lesbar sind. Relativ bekannt geworden sind dabei die großen Genom-Sequenzierungs-Projekte. Bei diesen wird die gesamte genetische Information in solche Buchstaben-Ketten verwandelt. Für viele Organismen, darunter auch uns Menschen, gibt es ein solches Referenzgenom. Allerdings ist die Erstellung eines gesamten Genoms trotz moderner Methoden immer noch relativ Zeit- und auch Kosten-Intensiv.

Als Alternative hat sich daher in vielen Bereichen das Erstellen des Transkriptoms anstelle des Genoms durchgesetzt. Bei dem Transkriptom sequenziert man nur jene Teile des Genoms die zu einem Zeitpunkt X gerade auch aktiv benutzt werden um in der Übersetzungsmaschine des Organismus von DNA zu RNA umgeschrieben (transkribiert) werden. Das spart nicht nur Zeit und Geld weil es weniger Material ist was man sequenzieren muss, sondern hat auch ganz praktische Anwendungsfälle: Es gibt nämlich nicht nur ein Transkriptom pro Art sondern ein Transkriptom für einen Zeitpunkt X pro Art. Denn welche Gene gerade aktiv sind verändert sich stark durch verschiedene Dinge: Umweltfaktoren, Lebensalter und eben auch Krankheiten. Die Unterschiede im Transkriptom kann man aktiv ausnutzen: So kann man schauen welche Gene aktiv oder inaktiv werden. Sei es durch Veränderungen in der Umwelt oder auch durch Krankheiten wie Krebs.  



Das klingt nun ganz einfach. Ist aber in der Praxis noch nicht ganz so simpel wie ein Mikrowellengericht zuzubereiten. Denn bei modernen Sequenzier-Techniken bekommt man am Ende nicht eine fertige, lange Zeichenkette mit der man arbeiten kann sondern viele kurze Fragmente. Ähnlich wie Puzzleteile überlappen diese zum Teil dann an den Enden. Was hier mit 4 Teilen noch recht einfach aussieht wird schon komplexer wenn man sich überlegt, dass nicht nur die Anzahl der Teile viel höher ist, sondern auch die Anzahl der Puzzle selbst. Denn am Ende hat man nicht nur ein fertiges Puzzle sondern ganz viele davon. Weil so ein Transkriptom besteht nicht nur aus einem einzelnen Gen sondern aus vielen einzelnen. Als Beispiel: Der Datensatz mit dem ich während meiner Thesis gearbeitet habe bestand aus fast 900.000 Puzzleteilen/Sequenzen die später zu gut 35.000 einzelnen Puzzlen/längeren Sequenzen zusammengesteckt wurden. Das ist schon eine Hausnmmer die man nicht mehr per Hand macht, egal wie sehr man Puzzle-Fan ist. Stattdessen benutzt man dazu sogenannte Assembly-Programme die für einen die Arbeit erledigen.



Aber selbst wenn man dann so weit ist, dass man die Puzzle zusammengebaut hat muss man feststellen: Der Informationsgehalt bislang geht gehen Null. Denn die Teile und auch die Puzzles selbst haben alle die gleiche Farbe. Damit man nun erkennt welches Bild eigentlich auf das Puzzle gehört, also was für ein Gen o. Ä. man da gerade hat, muss man wieder ein bisschen Arbeiten: Man muss die Sequenzen annotieren. Dies geschieht üblicherweise über riesige Datenbanken: Man vergleicht seine eigenen Sequenzen gegen andere und schaut ob es diese, oder nahe Verwandte, schon gibt. Aber auch dies ist eine Aufgabe die niemand per Hand machen möchte. Deshalb gibt es auch dafür Software-Lösungen mit passenden Algorithmen die sich um das Suchen kümmern.

Hört sich also so an, als wäre es ein Traum als Biologe mit Sequenzen zu arbeiten: Daten in den Computer, einen Knopf drücken, und ein bisschen später (wobei bisschen bei der Datenmenge meist: Wochen später) die Resultate in der Hand halten. Theoretisch ist das so. In der Praxis funktioniert das nicht so einfach. Alleine die Literatur-Recherche zur Wahl der richtigen Tools im Rahmen meiner Projektarbeit hat gut 8 Wochen gedauert. Und wenn man dann mal die ganzen Paper gelesen hat und sich für ein Set an Programmen entschieden hat fängt der Spaß erst richtig an. Denn Benutzerfreundlichkeit ist in der Open Source-Welt halt noch nicht so richtig angekommen.

Dazu muss man nur mal Gimp und Inkscape mit den überteuerten Äquivalenten von Adobe vergleichen. Wobei die Standard-Programme die man zur Transkriptom-Analyse benötigt lieber gleich auf eine graphische Benutzerführung verzichten und sich auf die Kommandozeile beschränken. So mächtig die Kommandozeile auch ist, so ziemlich alle Studien die ich finden konnte zeigen, dass neue Benutzer damit hoffnungslos überfordert sind. Dazu kommt dann noch die Tatsache, dass so ziemlich jedes Programm was ich mir angeschaut habe den Benutzer mit kryptischen Parametern überschüttet um ihn endgültig in den Wahnsinn zu treiben.

Die meisten Biologen werden mit der Webseite von NCBI BLAST eine Alternative zur Kommadozeilen-Version von BLAST kennen. Mit halbwegs aufgeräumten, graphischem User-Interface und der Möglichkeit die meisten Parameter einfach zu ignorieren. Stattdessen einfach die eigenen Daten hochladen, auf “Run” klicken, und irgendwann die Ergebnisse abholen. Und das hab ich nun, so ähnlich, für die Transkriptom-Analyse nachgebaut. Das Ziel: Seine Sequenzen hochladen, ein paar mal auf “Run” klicken, und am Ende eine hübsche Auswertung der Ergebnisse bekommen. Dabei ist das nicht ganz so trivial. Denn diese Aufgaben, so einfach puzzeln auch klingen mag, sind Rechen- und Zeitintensiv. Deshalb ist es eben nötig die verschiedenen Aufgaben wenn möglich auf verschiedene Computer zu verteilen.

Als Webframework hab ich dabei lustig mit Ruby On Rails rumgespielt während die Last-Verteilung auf verschiedene Maschinen per Distributed Ruby zum Zuge kam. Und im Endeffekt hat das auch ganz gut geklappt. Die Standard-Analysen kann man nun bequem von einem Web-Front-End aus bedienen. Dabei muss man die verschiedenen Programme nun nicht umständlich auf seinem Rechner installieren oder sich per Remote-Zugriff auf Servern einloggen sondern kann bequem die Server-Struktur des Instituts über seinen Browser bedienen. Neben dem initialen Zusammenbauen der Puzzles werden von dem Programm auch Punktmutationen erkannt, genauso wie die Annotation der fertigen Puzzle gegen verschiedene Datenbanken übernommen wird. Wer noch etwas mehr Informationen möchte kann dann auch gleich potentielle Protein-Sequenzen aus den Resultaten erstellen lassen und auch diese gegen Datenbanken annotieren lassen um zu schauen was die Proteine so tun sollten.  Getestet habe ich das ganze auch an einem Datensatz und kann nun sagen: Ja, es funktioniert.

Diese simple Klick-Bedienung hat dabei natürlich einen Nachteil: Eine Reduktion der Einstellungsmöglichkeiten macht es leicht möglich die gesamte Software zu bedienen. Unter Umständen fehlen einem damit aber genau die Parameter die man eigentlich haben möchte beziehungsweise benötigt. Bislang fehlt diese Möglichkeit in dem Web-Front-End das ich zusammengeschraubt habe noch. Aber NCBI BLAST löst das Problem dadurch, dass man diese Parameter als “Experten-Einstellungen” freigibt. Und das wäre wohl auch der nächste Schritt den ich implementieren werde. Aber erstmal ist nun eins angesagt, zumindest sobald ich die Verteidigung meiner Arbeit durch hab: Urlaub.

Bild: Wikipedia, CC-BY-SA



Geschrieben in Biologie . Kommentare: (5). Trackbacks: (1). Permalink


Gutes Lesen - Erfolg der Lehrer oder der Gene?

Bastian Greshake | 28. Juli 2010, 11:10

Es gibt ja viele Dinge für die unsere Gene gerne verantwortlich gemacht werden. Auch unsere Intelligenz. Oder eben das Fehlen davon. Dabei ist die Definition von Intelligenz schon gar nicht so einfach. Sind das logisch-mathematische Fähigkeiten? Sprachliche Fertigkeiten? Oder doch was ganz anderes? Und so wundert es auch nicht, dass der große Nachweis von Intelligenz-Genen bislang ausgeblieben ist, auch wenn man einzelne Gene ausmachen konnte die einen geringen Einfluss darauf haben.

Versuche mit Zwillingen deuten darauf hin, dass die Lesefähigkeit durch Gene prädestiniert sein könnte. Und Lesefähigkeiten sind in der Welt in der wir Leben nun mal extrem wichtig. Fast alles Wissen geben wir heute in Textform weiter. Sei es in Blogposts wie diesen, über die Wikipedia, über wissenschaftliche Veröffentlichungen oder recht schnöde in der Tageszeitung. Und dank des Internets hat der Text als solches auch wieder an Popularität gewonnen. Und auch Dinge wie Jugendstraffälligkeit korrelieren mit mangelnder Lesekompetenz.

Allerdings deuten andere Untersuchungen mit nicht-verwandten Kindern auch darauf hin, dass es eben doch auf die Fähigkeiten des Lehrers ankommt ob ein Kind später richtig lesen kann oder nicht. Prinzipiell ist das Problem eben, dass es schwierig ist herauszufinden ob die gefundenen Effekte auf genetische Grundlagen zurückgehen oder auf eine gemeinsame Umwelt.

Um dieses Problem zu minimieren macht man solche Studien zum Einfluss von Gegen gegenüber dem Einfluss der Umweltfaktoren üblicherweise mit Zwillingen. Eineiige Zwillinge teilen sich 100 % ihrer Gene während zweieiige Zwillinge sich 50 % der Gene teilen (lassen wir die große Unbekannte, die Epigenetik, mal außen vor). Damit kann man überprüfen ob die sichtbaren Effekte auf Umweltfaktoren oder Gene zurückgehen. Solche Zwillingsstudien haben in der Vergangenheit bis zu 82 % der Unterschiede in den Lesefähigkeiten auf genetische Faktoren zurückgeführt und dabei festgestellt, dass Unterschiede wie die familiären Bedingungen oder eben auch Lehrer kaum eine Bedeutung haben.

Diese Zusammenhänge könnten aber auch genauso gut daran liegen, dass die Unterschiede in den Umweltfaktoren innerhalb der Stichprobe zu klein waren um das wirklich beurteilen zu können. Denn in dem Fall wirkt der genetische Effekt in der Statistik größer als er wirklich ist. In einer neueren Studie, die im April in Science erschienen ist, hat man insgesamt 280 eineiige Zwillingspaare und 526 zweieiige Zwillingspaare während der ersten und zweiten Klasse aus Florida untersucht. Insgesamt sind diese dabei sogar repräsentativ für die ethnische und soziale Struktur des Bundesstaats. Wieso das wichtig sein könnte hat ja dieser Blogpost gezeigt.

Als Maßstab für die Lesefähigkeiten diente in der Studie der “Oral Reading Fluency Test” (ORF). Und sie hatten nicht nur die ORF-Werte für die Zwillingspaare, sondern auch die der Klassenkameraden. Aus den Steigerungen der allgemeinen ORF-Werte der Klasse im Laufe der Schuljahre haben die Forscher dann einen Index gebildet der als Maßstab für die Qualität des Unterrichts bzw. der Lehrer erstellt.

Und das Ergebnis davon ist: Weder Lehrer noch Genetik alleine sind ausschlaggebend für Lesefähigkeiten. Stattdessen liegt es an den Fähigkeiten des Lehrers in wie weit die genetischen Faktoren ausgespielt werden können. Also selbst jemand der gute, genetische Vorraussetzungen hat wird diese nicht nutzen können wenn der Lehrer nicht die Rahmenbedingungen dafür bietet. Aber das heisst auch andersrum: Gute Lehrer können Schülern helfen ihr (genetisches) Potential auszuschöpfen. Das deckt sich auch mit dem allgemeinen Interaktionsmodell von Umwelt & Genen: Genetische Einflüsse brauchen passende Rahmenbedingungen um ausgespielt werden zu können.


Geschrieben in Biologie , Psychologie . Kommentare: (2). Trackbacks: (0). Permalink


Von bizarren Wespen: Wie aussagekräftig sind Ergebnisse der Verhaltensforschung?

Bastian Greshake | 25. Juli 2010, 19:38

WASP, das ist nicht nur der Name einer amerikanischen Heavy Metal-Band sondern auch das Kürzel was „White Anglo-Saxon Protestants”, also weiße, angelsächsische Protestanten, beschreibt. Und das ist so die Bevölkerungsgruppe die bis in die erste Hälfte des 20. Jahrhunderts die Elite in den Vereinigten Staaten bildeten. Etwas gröber gefasst ist da die Bevölkerungsgruppe die sich WEIRD, und damit nicht nur wortwörtlich bizarr, nennt. WEIRDs sind „Western, Educated, Industrialized, Rich and Democratic”.

Und auch wenn der Fokus der WEIRDs nicht ganz so eng ist wie bei den WASPs sind sie, bezogen auf die Weltbevölkerung, alles andere als repräsentativ. Denn der Großteil der Weltbevölkerung kommt weder aus der westlichen Welt, noch ist er gebildet, reich oder Demokrat. So weit so gut. Aber ein Blogpost auf „Ionian Enchantment” und ein Paper in der letzten Ausgabe von „Behavioral & Brain Sciences” werfen Fragen auf: Was bedeutet diese Bevölkerungsgruppe für wissenschaftliche Ergebnisse?

Denn nicht nur der Großteil der Forscher selbst gehört zu den WEIRDs sondern auch der größte Teil der Versuchspersonen die in der Verhaltensforschung eingesetzt werden gehören zu den WEIRDs. Was nicht zwingend falsch ist, auch diese Untergruppe könnte für die Gesamtheit der Menschheit ja repräsentativ sein. Aber leider scheint das nicht der Fall zu sein. In dem Paper und auch in dem Blogpost wird als Beispiel dafür die Müller-Lyer-Illusion angeführt die hier auch in dem Bild zu sehen ist. Die obere Linie erscheint kürzer als die untere.

Allerdings gilt das eben nicht für alle Menschen. Während die WEIRDs dieses Phänomen recht konsistent sehen tritt es in anderen Kulturräumen und anderen Bevölkerungsgruppen nicht auf. Ein Beispiel dafür sind die San. Deren Kultur basiert noch ganz traditionell auf jagen & sammeln. Und für die sehen die Linien gleich lang aus. Genauso wie für süd-afrikanische Bergleute. Und wenn man sich einfach mal den Vergleich über verschiedene Kulturräume anschaut sieht man, dass die WEIRDs eine absolute Ausnahme am oberen Ende darstellen.

Der PSE ist ein Wert dafür wie stark unterschiedlich lang die Linien wahrgenommen werden. Dazu aufgetragen verschiedene Test-Populationen. Außerdem wurde unterschieden in Erwachsene und Kinder.

Was in letzter Konsequenz bedeutet, dass sämtliche Erklärungsmodelle die auf der Müller-Lyer-Illusion fussen eben nicht für die Menschheit an sich gelten können, sondern nur für WEIRDs. Besonders wenn man sich klar macht, dass Jäger & Sammler viel näher an der evolutionären Menschheitsgeschichte orientiert sind als die WEIRDs die eine Ausnahme sind. Es fehlt dort also an einer ausreichend durchmischten Stichprobe die für Versuche benutzt wird.

In dem Blogpost auf „Ionian Enchantment” werden auch Gründe genannt wieso es zu dieser Verschiebung der Stichprobe kommt: Der gesamte Wissenschaftsbetrieb, gerade in den Verhaltenswissenschaften, führt dazu. Die meisten solcher Versuche werden in westlichen Ländern von WEIRDs selbst geplant und durchgeführt. Die Versuchspersonen rekrutieren sich meist aus Studenten die ihrerseits wieder nur WEIRDs sind und bilden so am Ende eine sehr homogene Gruppe. Und solche Studien enthalten am Ende dann eben keine Einblicke in die menschliche Natur. Sondern in die Natur der WEIRDs.

Um diesen Problem zu entgehen muss man nicht nur die Menge der Versuchspersonen weiter durchmischen um ein repräsentatives Bild einzufangen. Sondern auch die Forscher müssen sich aus anderen Kulturräumen rekrutieren. Wenn man Leute Experimente designen lässt die nicht WEIRD sind werden sie ganz andere Fragen stellen, andere Lösungsansätze ausprobieren und so zu ganz anderen Lösungen kommen. Andernfalls werden WEIRDs Lösungen für WEIRDs ausprobieren und somit WEIRDs näher betrachten.

Diesen Vorgang kennt man aus der Medizin übrigens bereits etwas länger. Unter dem Stichwort „Racial Medicine” kennt man bereits Medikamente die in manchen Gruppen, unterschieden durch Kulturräume, Hautfarben etc., besonders gut oder besonders schlecht wirken. In dem Fall hat das natürlich meist nichts mit Merkmalen wie der Hautfarbe sondern mit anderen genetischen Dispositionen zu tun die besonders häufig an das betrachtete Merkmal gekoppelt sind. Doch auch dort wird es zum Problem wenn man immer nur eine bestimmte Bevölkerungsgruppe als Testreferenz heranzieht anstatt als Basis eine heterogene Gruppe zu betrachten.


The weirdest people in the world?

Joseph Henrich,Steven J. Heine and Ara Norenzayan (2010).
Behavioral and Brain Sciences, Volume 33, Issue 2-3, June 2010 pp 61-83
http://journals.cambridge.org/action/displayAbstract?aid=7825833
Bilder:
Müller-Lyer-Illusion: Wikipedia CC-BY-SA
Graph: Ionian Enchantment


Geschrieben in Biologie . Kommentare: (3). Trackbacks: (0). Permalink


Gedankenkontrolle durch Parasiten?

Bastian Greshake | 23. Juli 2010, 21:25

Toxoplasmose ist eine Krankheit die der eine oder andere vielleicht von Katzen kennt und daher, dass schwangere Frauen sich aus dem Grund von Katzen fern halten sollen. Denn für das ungeborene Kind kann die Krankheit nicht ganz so unproblematisch sein. Und anders als die Ärztin eines Kommilitonen behauptet wird diese Krankheit nicht von Bakterien ausgelöst sondern von einem einzelligen Parasiten namens Toxoplasma gondii.

Übertragen wird die Krankheit zwischen Katzen unter anderem durch Nagetiere. Diese nehmen die Parasiten auf, werden gefressen und infizieren so andere Katzen. Das spannende dabei ist, dass infizierte Nager ihr Verhalten dabei ändern: Sie verlieren die Scheu vor Katzen und suchen besonders häufig Orte auf an denen es nach Katzen-Urin riecht. Dies liegt wohl an der Parasiten-Infektion die so dafür sorgen, dass die Chance steigt es wieder in eine Katze zu schaffen.

Menschen können sich mit dem Parasiten über Katzen-Kot oder auch über rohes Fleisch von infizierten Tieren (nein, nicht zwingend Katzenfleisch) selbst mit dem Parasiten anstecken. Je nach Bevölkerungsschicht sollen bis zu 80% der Leute infiziert sein oder infiziert gewesen sein. Denn neben der akuten Infektion bei denen Symptome wie geschwollene Lymphknoten auftreten können gibt es auch die latente Infektion bei denen die meisten Betroffenen gar nichts davon mitbekommen.

Doch neben geschwollenen Lymphknoten soll es auch andere Symptome geben: Einigen Studien zufolge gibt es auch bei Menschen zumindest eine Korrelation zwischen der Infektion mit dem Parasiten und bestimmten Verhaltensweisen. Seit 1992 wird in der tschechischen Republik eine Reihe von Studien dazu durchgeführt die schauen wie das Vorhandensein von Antikörpern gegen den Parasiten, die als Marker für eine latente Infektion benutzt werden, mit bestimmten Verhaltens- und Persönlichkeitsmerkmalen zusammenhängen.

Unter den Testpersonen waren Studenten der biologischen Fakultät, Angehörige des Militärs, Blutspender, Frauen die während der Schwangerschaft gegen den Erreger getestet wurden und auch Personen bei denen eine Toxoplasmose bereits bekannt war. Bei diesen Studien konnte man diverse Unterschiede feststellen. Und das nicht nur zwischen Infizierten und Nicht-Infizierten sondern auch zwischen infizierten Männern und Frauen.

Infizierte Männer halten sich der Studie nach weniger an Regeln, sind misstrauischer, eifersüchtiger und rechthaberischer als die nicht-Infizierten. Infizierte Frauen hingegen sind warmherziger, aufgeschlossener, gewissenhafter und beharrlicher und moralischer als die nicht-Infizierten. Außerdem ist die Reaktionszeit der Infizierten eingeschränkt, woraus sich eine erhöhte Unfallwahrscheinlichkeit ergibt.

Das ist alles schon sehr spannend. Aber natürlich sagen diese Zahlen nichts über Ursache und Wirkung aus. Haben Leute mit solchen Charakterzügen einfach ein erhöhtes Infektionsrisiko? Oder verändert die Infektion das Verhalten in diese Richtung? Leider kann man das nicht so einfach beweisen. Wirkliche Aussagekraft hätte wohl nur ein Vorher/Nachher-Vergleich.

Doch was sollte der Grund dafür sein, dass der Parasit das Verhalten von Menschen verändert? In Nagern ist das sinnvoll, da so die Verbreitung sichergestellt wird. Doch Menschen sind eine Sackgasse für den Parasiten, denn die Chancen, dass ein Mensch von einer Katzenart gefuttert wird sind, gelinde gesagt, eher gering.

Die Macher der Meta-Studie schlagen jedoch vor, dass es in evolutionären Zeiträumen allerdings gar nicht so unwahrscheinlich gewesen sein könnte, dass Menschen oder eben Affen von Katzen verspeist wurden. An der Elfenbeinküste ist es wohl immer noch so, dass Affen einen Großteil des Nahrungsanteils von Leoparden dort ausmachen. Allerdings: Das bleibt alles Theorie bislang.

Doch sollte man dieses Zusammenspiel nachweisen können hätte das spannende Konsequenzen: In wie weit sind wir selbst dann noch verantwortlich für unsere Handlungen und in wie weit nur ferngesteuert durch einen Parasiten?

Geschrieben in Biologie , Psychologie . Kommentare: (10). Trackbacks: (0). Permalink


Umfragen als neuer Weg zum annotierten Genom

Philipp Bayer | 13. Juli 2010, 16:02

Die in Kalifornien ansässige Firma 23andMe ist einigen Lesern wahrscheinlich bekannt, bietet sie doch seit geraumer Zeit für ca. 500 Dollar eine Untersuchung der eigenen Gene in Hinsicht auf Krankheitsrisiken an. Nun hat die Firma sich auch auf den Pfad der Genom-Annotation begeben. In der Genom-Annotation versucht man, zu Genen oder Genabschnitten eine bestimmte Funktion oder Auswirkung im Organismus zuzuweisen - und dafür hat 23andMe einen neuen Weg aufgezeigt. Letzten Monat veröffentlichte 23andMe in PLoS Genetics ein Paper mit dem recht umständlichen Namen "Web-Based, Participant-Driven Studies Yield Novel Genetic Associations for Common Traits", in der erstmals die web-basierte Befragung der Firmenkunden über gewisse, ererbte Eigenschaften wie z.B. Sommersprossen versucht wurde.

 (weiter)

Geschrieben in Biologie . Kommentare: (1). Trackbacks: (1). Permalink


Distributed Ruby unter Mac OS 10.6

Bastian Greshake | 26. Mai 2010, 20:25

Die Überschrift klingt schon extrem trocken und technisch. Aber das Thema hat mich im Rahmen meiner Bachelorarbeit an dem Institut für Evolutionsbiologie und Biodiversität ereilt. Die Slides oben sind aus dem Vortrag zu meiner Projektarbeit die sich mit den Software-Lösungen zur Analyse von Transkriptom-Daten beschäftigt. Das Transkriptom sind kurz gesagt all jene Gene die zu einem bestimmten Zeitpunkt X (in dem man die Proben nimmt) exprimiert werden, also aktiv sind.

Das ist zum einen spannend weil es erlaubt Unterschiede zwischen verschiedenen Zeitpunkten zu nehmen um so Rückschlüsse zu den Aufgaben von verschiedenen Genen zu ziehen. Und das hat natürlich nicht nur etwas mit schlichten Zeitreihen zu tun sondern klappt auch mit äußeren Einflüssen.

Beispielsweise kann man die Unterschiede in der Genaktivität zwischen kranken und gesunden Organismen (also Bakterien, Pflanzen, Tiere & Co) so bestimmen oder auch zwischen verschiedenen Umweltbedingungen in denen Organismen so heimisch sind.

Und zum anderen ist es vergleichsweise einfach (und auch billig) an Transkriptom-Daten zu kommen, zumindest wenn man sich anschaut welch ein Aufwand das Gewinnen von kompletten Genomen immer noch ist.

Und wenn man viele Daten gewinnen kann dann muss man die auch irgendwie effizient analysieren können. Sonst sind sie recht wertlos. Und da kommt meine Bachelor-Arbeit wieder ins Spiel: Ich arbeite an einer Software-Pipeline welche viele der Tools die in der Präsentation erwähnt beheimaten soll und die es dem Benutzer einfach machen soll seine Analysen ohne tiefergreifende Kenntnisse in die verschiedenen, einzelnen Tools umzusetzen.
magic
Umgesetzt werden soll das Ganze als Web-Applikation mit dem Framework Ruby On Rails. So kriegt man eine hübsche Webseite mit viel Klicki-Bunti die im Idealfall alle gewünschten Aufgaben erledigen kann. Da die einzelnen Berechnungsschritte der Analysen, gerade bei großen Datenmengen, einige Zeit lang dauern können ist es sinnvoll die Möglichkeit zu haben die einzelnen Jobs die Benutzer einreichen auf mehrere Maschinen verteilen zu können.

Außerdem hat Rails, abhängig vom verwendeten Webserver, ein Problem damit wenn einzelne Aufgaben zu lange benötigen (und wer will schon Tagelang auf eine Webseite starren müssen?). Ruby (die Sprache in der Rails geschrieben ist) bietet genau dafür mitgelieferte Lösungen mit. Und zwar Distributed Ruby (DRb). Man kann damit auf verschiedenen Rechnern Ruby-Server bereitstellen die auf Ansprachen über Ruby reagieren und dann lustige Dinge für einen tun.

Zumindest in der Theorie und unter Linux funktioniert das auch ganz wunderbar. Leider wollt ich nun unter Mac OS 10.6 anfangen an dem Code zu schrauben. In der Theorie auch hier kein Problem. Ruby ist installiert und auch die DRb-Bibliotheken sind vorhanden. Leider scheint es irgendwo einen Bug zu geben. Denn sobald man die DRb-Funktionalitäten verwenden will fliegt einem alles um die Ohren. Beziehungsweise es wäre schön, wenn es denn so wäre.

Denn es passiert einfach gar nichts. In der Webapplikation hängt sich einfach alles auf und die einzige Möglichkeit da zu entkommen ist es den Server mit aller Gewalt zu beenden. Und auch in der Programmier-Konsole lässt sich das Problem nachvollziehen. Mit dem gleichen Ergebnis und im Idealfall nimmt Ruby dann also gleich das ganze Terminal mit in den Abgrund. Wunderbar.

Bislang umgehe ich das Problem einfach damit, dass ich in einer virtuellen Maschine ein Ubuntu installiert habe und dort die Server für das Distributed Ruby laufen lasse. Da sämtliche Source-Files in einem Dropbox-Ordner liegen kann ich sie auch ganz bequem von Mac OS aus bearbeiten ohne ständig auf der virtuellen Maschine zu arbeiten. Das ist zwar keine schöne Lösung, aber bislang besser als gar keine.  

Falls ihr also eine gute Idee habt oder im Idealfall selbst betroffen seid von dem Problem: Ich freue mich über Lösungsideen oder Berichte von Leidensgenossen.

Geschrieben in Biologie . Kommentare: (0). Trackbacks: (0). Permalink


Wie Schlangen Wärme "schmecken"

Philipp Bayer | 14. März 2010, 21:43

Vipern können bis zu einem Meter entfernte Wärmequellen spüren - wie funktioniert das, trotz ihrer eher schlecht entwickelten Augen? Man wusste schon seit mehreren Jahren, dass sogenannte Grubenorgane an der Spitze der Köpfe einiger Schlangen für die Infraroterfassung zuständig sind. Allerdings war nicht bekannt, wo die Sensoren genau liegen - liegen sie in den Membranen, oder doch weiter im Organ? In Nature Advance erschien dazu heute ein Paper, in dem der zugrundeliegende Mechanismus genauer auf molekularer Ebene untersucht wurde.  (weiter)

Geschrieben in Biologie . Kommentare: (0). Trackbacks: (0). Permalink


Vier auf einen Streich

Philipp Bayer | 12. März 2010, 13:18

Vier auf einen Streich

Gestern kam über Twitter eine interessante Nachricht rein - im aktuellen Science Express ist die erste Studie zu finden, in der zum ersten Mal die Genome einer vierköpfigen Familie vollständig sequenziert wurden! Das Besondere an dieser Familie ist das Vorhandensein gleich zweier rezessiv vererbten Krankheiten - alle Familienmitglieder tragen die rezessiven Allele für das Miller-Fisher- und das Kartagener-Syndrom. Bei den Kindern der Familie sind beide Syndrome auch zum Vorschein getreten (Wer mir die Wahrscheinlichkeit dafür in Prozent in die Kommentare schreibt hat in der Schule aufgepasst).

 (weiter)

Geschrieben in Biologie . Kommentare: (4). Trackbacks: (0). Permalink


Die "wunderbare" Welt der Bettwanzen

Philipp Bayer | 08. Februar 2010, 22:57

Mensch sein hat doch so seine Vorteile - wenn man sich das Geschlechtsleben anderer Tiere so anguckt, ist man doch froh dass das eigene so verhältnismäßig unkompliziert verläuft ...
 (weiter)

Geschrieben in Biologie . Kommentare: (0). Trackbacks: (0). Permalink


Noch mehr Python: Das Ziegenproblem

Bastian Greshake | 05. Februar 2010, 22:18

Nachdem ich im letzten Blogpost das „Iterated Prisoners Dilemma“ kurz erklärt habe kommt nun der nächste Python-Code-Block auf euch zu. Und zwar in Form des Ziegenproblems.

Das Ziegenproblem ist auch unter dem Namen „Monty-Hall-Problem“ bekannt, benannt nach dem gleichnamigen, amerikanischen Showmaster der Spielshow „Let‘s make a deal“. Die Sendung sagt vermutlich niemandem hier etwas. Aber sie ist das Gegenstück zu „Geh aufs Ganze“, ihr wisst schon. Die Sendung mit dem roten Vieh namens ZONK. (weiter)

Geschrieben in Biologie . Kommentare: (3). Trackbacks: (0). Permalink


szmtag