Mittwoch, 8. Mai 2013

Tag 13 - Mittwoch 08.05


Da ist er nun der letzte Tag des Praktikums, ich bin zwar schon ziemlich kaputt von den 2 1/2 Wochen doch es hat mir viel Spaß gemacht.

In meinem Abschlussgespräch heute habe ich bestätigt wie toll ich das Praktikum fand. Außerdem hat sich Prof. Leser mein Programm angeguckt.

Da es heute nicht sehr viel zu erzählen gibt habe ich mal den Quellcode des Programms eingefügt.
Mir hat das Praktikum sehr gut gefallen und ich kann es jedem empfehlen der irgendwann mal in der Informatik arbeiten möchte.

Tag 12 - Dienstag 07.05

Ich habe heute mein Programm fortgesetzt.
Mein  ersten Schritt war es die Eingaben so zu verbinden damit sie den Variablenwert bestimmen.
Das klappte nicht ganz so wie ich es wollte. Aber statt darauf zu kommen dass es an den Eingaben liegt dachte ich mein Button meine Funktion nicht auslöst.

Ich habe jedoch von Stefan den Tipp bekommen erstmal die Variablen vor meinen Schleifen abzufragen.
Durch diese Hilfe wurde klar das meine Textfelder nicht richtig angewendet wurden.

Nach dem ich das nun endlich hin bekommen hatte, sollte ich die Ausgabe bearbeiten damit man im Text die Muster farbig hervorgehoben erhält. Dies war jedoch ziemlich knifflig da ich mit dem neuen Befehl "substring" arbeiten musste der aus einem Text einen Teil heraus extrahiert. Diesen extrahierten Text musste ich dann färben - das klappte, nun wollte wir aber den gesamten Text haben und nicht nur das Muster.

Um zu erreichen das wir den Teil vor dem Match hatten mussten wir das Ganze auch mit "substring" einfügen. Das größte Problem war jedoch für mich den Rest richtig einzufügen da dort mit 2 Variablen gearbeitet wurde und ich erst überlegen musste wo das Ganze einsetze. 

Heute hatte ich auch ohne ein Gespräch viel zu tun.

Ich bin sehr stolz darauf heute alles geschafft zu haben, da ich so etwas vorher noch nie gemacht habe. 

Dienstag, 7. Mai 2013

Tag 11 - Montag 06.05.

Die letzte Woche bricht an und ich bin darüber ein wenig traurig da hier alles sehr interessant ist und ich viel Neues lerne. Nun aber zu meinem Tag ich habe heute weiter an meiner Aufgabe gearbeitet und versucht meine Funktion mit einem Button aufzurufen. 

Um das zu erreichen habe ich lange recherchiert, auf SelfHTML. Doch am Ende habe ich die Befehle gehabt nun hatte ich das Problem das das ganze nicht klappt obwohl alle Befehle richtig waren.
Als die Lösung stand war es auch schon Zeit für mein Gespräch mit Lars.

Er arbeitet nicht wie die meisten anderen an biologischen Themen er arbeitet im Bereich der Erdbebenforschung.
Er analysiert mit Hilfe von einem Algorithmus die Opferzahlen bei Erdbeben. Theoretisch lässt sich das Ganze mühelos auch auf andere Katastrophen zur Berechnung des Anstiegs der Opferzahlen anwenden.
Für diese Analyse werden Texte über solche Katastrophen abgesucht nach bestimmten Schemen also wieder eine Art text minen.

Die Ergebnisse werden in einer Tabelle dargestellt um das Schema zu vereinfachen kann man es auch als Graph darstellen mit gerichteten Kanten. Dieses Gesamtthema nennt man Inhalte-Extraktion.
Das kann genutzt werden um zu bestimmen wie viele Ressourcen an Rettungskräften für das Gebiet benötigt werden.

Meiner Meinung nach ist diese Forschung sehr wichtig das es in vielen Gebieten auch gut genutzt werden kann.

Tag 10 - Freitag 03.05.

Heute habe ich weiter an meiner Aufgabe gearbeitet und am Ende des Tages die Grundfunktion fertig gestellt.
Das Problem an der Grundfunktion ist, dass nun die vergleichenden Texte im Quellcode verankert sind das bedeutet ich kann weder neue Texte einfügen noch das Muster selbst bestimmen. Deshalb musste ich nun eine HTML-Seite erzeugen auf der ein Textfeld für meinen Haupttext und einen Textkasten für mein Muster existiert. Da der Tag aber schon vorbei ist habe ich es nicht mehr geschafft die Komponenten zu verbinden.

Natürlich hatte ich auch heute wieder ein Gespräch. Micha ist Bioinformatiker und nimmt an einem Projekt der Charité teil. In diesem versucht man den genauen Aufbau der Leber als animierte Grafik zu simulieren. Dabei wird jedoch nicht nur die Leber als Organ betrachtet sondern auch alle Abläufe auf Mikroebene. Um das alles zu ermöglichen muss man jedoch auch chemische Verbindungen im Ablauf finden und deren Funktion. Das versucht Micha, er sucht für die Leute im Labor Reaktionen die diese dann testen können. Die Informationen die Micha benutzt sucht er sich aus Publikationen im Internet mit den text minen.

Das war zwar nur eine einfache Darstellung der Dinge, aber genau so das ich es verstehen konnte.
Mir persönlich hat es sehr gut gefallen.

Tag 9 - Donnerstag 02.05.

Der neunte Tag des Praktikums und heute begann meine neue Aufgabe.

Zuerst hatte ich aber ein Gespräch mit Marc, er arbeitet mit Workflows aber nicht wie Jörgen für die graphische Darstellung von Daten.
Marc versucht die Arbeitsabläufe eines Workflows auf verschiedene PC optimal auf zu splitten weil es nicht nötig ist einen super PC zu kaufen für eine einmalige Berechnung da es es gibt verschiedene Firmen die Rechenkapazitäten verleihen. Für unser Bsp. nehmen wir Amazon. Wir haben eine Menge an Daten die es zu analysieren gilt, dafür brauchen wir aber mehr Rechenleistung, also leihen wir welche bei Amazon. Nun bekommen wir aber nicht die gesamte Leistung eines Computers weil ein anderer auch auf diesem Rechner arbeitet. Wir bekommen also nur insgesamt die Rechenleistung sie muss nicht auf einem einzigen PC sein. Da der andere auf dem PC diesem nun eine menge Rechenleistung abfordert wäre es unklug  ihm eine Aufgabe zu geben die viel Rechenleistung benötigt damit er nicht ewig braucht nun hat dieser  Rechner aber vielleicht eine gute Bandbreite dann könnte man ihm Aufgaben zur Verteilung im Netzwerk geben. Diese Optimierung versucht Marc zu erreichen damit möglichst wenig Zeit benötigt wird um die Kosten gering zu halten.

Meine neue Aufgabe ist eine Suchmaschine die Muster in Texten sucht. Dafür benutze ich einen naiven Algorithmus . Zuerst sollte ich einen Pseudo Code erstellen. Als dieser fertig war habe ich das ganze ich Javascript aufgeschrieben.


Freitag, 3. Mai 2013

Tag 8 - Dienstag 30.04.

Heute habe ich den Admin Bereich des Omix Analyzer getestet. Dort sollte ich die verschiedenen Funktionen testen, eine Funktion ist das Benutzer hinzufügen oder löschen. Falls etwas nicht funktioniert sollte ich ein Ticket schreiben.

Am Nachmittag habe ich heute mit Karin gesprochen, sie hat als erstes am Analyzer gearbeitet und konnte mir deshalb auch viele der Funktionen und Analysen erklären.

Ihre eigentliche Arbeit ist jedoch eine andere ,sie sucht nach Unterschieden von Proteinen aus dem selben Abschnitt des Gens. Aus dem Gen werden Exons von Introns getrennt diesen Vorgang nennt man transkribieren . Die Exons werden dann wieder zusammen gebastelt das heißt Splicing. Aus jedem Teil des Exons werden drei Nukleotide.

In der Translation werden aus den verschiedenen Nukleotiden Proteine. Es werden jedoch nicht alle Nukleotiden in einem Protein benutzt es können z.B. nur E¹ und E³ benutzt werden wobei sie P⁴ ergeben und E¹ ,E² und E³ ergeben P¹.

Beim Alternativen Splicing kommt es zu Fehlern z.b.  wird ein Intron nicht von den Exons getrennt.

Karin untersucht den Unterschied zwischen den Proteinen bei gesunden und kranken Menschen und versucht das Gen zu finden das nicht richtig funktioniert und ein falsches Protein das eine falsche bzw. gefährliche Funktion ausübt.

Tag 7 - Montag 29.04.

Nun sind schon sieben Praktikumstage vorbei und es ist immer noch alles super spannend. Ich lerne viel neues und wahrscheinlich ist vieles 2-3 Jahre vor dem Biologieunterricht voraus.

Ich habe heute mit Phil gesprochen.Er hat mich über zwei Methoden des "text minen" aufgeklärt. Die erste war das Oberflächenpattern bei der zwischen zwei  Personen bzw. Gegenständen eine Verknüpfung erstellt wird, die erklärt wie die beiden sich zueinander verhalten. Ein Bsp. dafür wäre Marc mag Peter.

Die zweite Möglichkeit sind die syntaktischen Pattern dabei wird die Verbindungen der einzelnen Elemente in Graphen dargestellt, um es möglichst übersichtlich zu gestalten. Das Ganze funktioniert an ganz einfachen Sätzen, wie z.B. Mark mag Birnen, sehr gut da es weder mehrere Personen noch mehrere Objekte gibt.

Es gibt, jedoch auch Sätze ,die man den Satz verschieden interpretieren kann, als Bsp. Marc mag Äpfel und Peter auch. Eine Interpretation wäre Marc mag Äpfel und er mag Peter auch. Es geht aber auch Marc mag Äpfel, Peter mag Äpfel auch.

Der Computer hätte nun Schwierigkeiten ohne zusätzlichen Text die richtige Interpretation zu finden.


Da der Computer jedoch nicht von selbst diese Fehlinterpretationen erkennt gibt es wieder die Methode den maschinellen Lernens, doch diesmal nicht auf der Suche nach Identitäten, sondern auf Suche nach Verknüpfungen wie zwei Menschen zueinander stehen. Also die Beziehung zwischen zwei Personen dafür kann man im Internet suchen als Bsp. Jonny Depp und Kate Moss waren mal verlobt.

Donnerstag, 2. Mai 2013

Tag 6 - Freitag 26.04

Heute habe ich gleich zwei Gespräche, zuerst mit Jörgen und dann mit Astrid.
Das Gespräch mit Jörgen war sehr informativ über die Möglichkeit Daten aus Tabellen mit sogenannten Workflowsystemen graphisch darzustellen. Diese Workflowsysteme arbeitet wie eine selbstgeschriebene Software nur das man ein wenig eingeschränkter ist dafür hat man aber auch sehr viel Zeitersparnis welches einem natürlich nützlich sein kann. Workflowsysteme können in verschiedenen Bereichen eingesetzt werden wo Menschen miteinander arbeiten. Da es lange dauern würde jemandem zu erklären woran man gearbeitet hat, kann man es mit Workflowsystemen ganz einfach darstellen ohne dafür wieder ein Programm zu schreiben.
Wie man auf dem Bild erkennt kann wurde im ersten Schritt aus einer unübersichtlichen Aneinanderreihung von Zahlen ein übersichtliche Tabelle. Im zweiten Schritt wurden den drei verschiedenen Versuchsobjekten ein Farbe gegeben welche durch den letzten Schritt zu einer Grafik dargestellt wurde.


Astrid hat mir jetzt auch noch erklärt was sie macht. Meiner Meinung ein sehr wichtiges und spannendes Thema. Sie arbeitet daran das verschiedene Vorgänge auf viele Computer aufgeteilt werden. Das nennt man "Verteiltes Rechnen". Für dieses Verteilen gibt es verschiedene Programme wie z.B. Hadoop.
Man nennt dieses Netzwerk für die verschiedenen Aufgaben auch Cloud. In einer solchen Cloud weiß man jedoch nicht wo genau die Daten im Moment sind. Das ganze System wird auch bei Facebook angewandt. Dort werden einem Menschen vorgeschlagen mit denen viele meiner bisherigen Freunde befreundet sind.


Durch die Verteilung der Aufgaben auf mehrere PCs ergibt sich zum einem die Möglichkeit das ganze schneller und effektiver zu gestalten. Bei größeren Datenmengen wie z.B. Wikipedia gibt es gar keine andere Möglichkeit diese ganzen Text mit einem PC zu "textminen" (siehe Tag 2).

Montag, 29. April 2013

Tag 5 - Girls Day 25.04.2013

Gestern war Girls Day und ich denke es war für mich sehr informativ die anderen Lehrstühle endlich mal kennen zu lernen.  Der Anfang ging erstmal total durcheinander ich wusste nicht wohin ich gehen sollte oder mich nützlich machen konnte. Als dann der anfangs Vortrag über die Humboldt Universität vorbei war ging mit Berits Gruppe zu ihrer 1.Station der theoretischen Informatik.
 Dort wurde ihnen als Aufgabe gegeben sie sollten ein Netzwerken aus Bekannten bilden , wobei man nur die kannte, mit denen man mit Crêpepapier auf dem Tisch verbunden war. Sie durften nur ihren Bekannten Nachrichten schicken so sollten sie ermitteln wer als nächstes Geburtstag hat. Nach der Aufgabe gab es Rätsel die ihnen den Raum ihrer nächsten Station nannten. Ich selbst musste auch ein sehr leichtes Rätsel lösen was Aufschluss darüber gab wie gut ich aufgepasst habe während der Präsentation.

Die 2.Station war der Fachbereich Signal- und Informationanalyse in den Neurowissenschaften. Dort gab es 3 Präsentationen über die verschiedenen Methoden im Gehirn Signal im Gehirn zu analysieren z.B. mit einem MRT. Am Ende gab es noch das Rätsel für die nächste Station wobei immer Wörter vorgegeben waren und man ein Wort finden sollte was man sowohl anhängen als davor setzen kann. 

So kamen wir in die Eingangshalle zur technischen Informatik.
Dort stellten sie uns einem Transportroboter vor ,der eine bestimmte Route innerhalb eines Gebäude fahren kann und Hindernissen ausweichen kann. Hier gab es kein Rätsel es ging also zum Mittagessen. Doch das ganze war nicht wirklich gut organisiert sodass es ein bisschen drunter und drüber ging.

Nachdem Mittag ging es zur 4. Station der Signalverarbeitung und Mustererkennung dort mussten die Mädchen eine Nachricht wiederherstellen indem sie erst Drähte wieder repariert haben aber auch in der richtigen Reihenfolge und dann die Nachricht entschlüsseln.

So kamen wir an unsere 5. Station der Bioninformatik wobei hier mehr auf die Verknüpfung zwischen Informatik und den Geisteswissenschaft besonders der Philosophie. Als Beispiel haben wir das Thema KI (künstliche Intelligenz), dafür stellten wir uns die Frage "Was genau ist den Intelligenz?".
In diesem Thema kann wohl jeder eine eigene Meinung haben aber ein paar Oberbegriffe könnte man schon als Grundidee der Intelligenz  finden. Wir testeten ob ein Chatbot nach diesen Oberbegriffen nun Intelligent ist und fragten ihn auch nach unseren letzten Station.

Diese war dann die kognitive Robotik wo kleine Helikopter gebaut werden welche mit Sensoren möglichst nicht gegen Wände fliegen und sich beim Fliegen selbstständig korrigieren damit sie nicht schräg fliegen.

Am Ende ging es wieder ins Humboldt-Kabinett wo alle Gruppen ihre Themen vorstellten.
Als dann alles vorbei war, war ich ein wenig müde besonders wegen der vielen Zeit des Stehens.

Mein Fazit:
Hammer anstrengend aber auch spannend

Freitag, 26. April 2013

Tag 4 - Mittwoch-24.04.2013

Nun ist der 4.Tag vorbei und das Praktikum macht immer noch genau soviel Spaß wie am Anfang.
Das beste heute war mein Gespräch mit Berit, da sie eine der wenigen Diplom Bioinformatikerin ist die es hier gibt. Da die meisten Informatiker sind und daher auch in vielen in anderen Bereichen Anwendungen finden ist es interessant was sie macht. Berit arbeitet mit Genexpressionsdaten sie vergleicht die Expression zwischen 2 Zuständen der Zelle z.B. zwischen unbehandelten kranken Zellen und behandelten kranken Zellen. Die Ergebnisse werden meist in Form einer Tabelle dargestellt. Die Korrelationsdaten werden in Netzwerken graphisch dargestellt und bei einer Ähnlichkeit zwischen den beiden Ergebnissen werden die Kanten hervorgehoben.

Für die Analyse gibt es verschiedene Methoden. Da es manchmal zu Messfehler bzw. unterschiedlichen Ergebnissen kommt, ist es nützlich die Ergebnisse der unterschiedlichen Methoden zu vergleichen.

Ich freue mich auf Morgen ,da ich dann die anderen Lehrstühle kennen lernen werde. Bin gespannt wie der Girls Day für mich abläuft.

Fazit von Heute:
Spannend

Donnerstag, 25. April 2013

Tag 3 - Dienstag 23.04.


Ich habe heute weiter die Software getestet und versucht zu verstehen was die Ergebnisse bedeuten.
Das Verstehen von so hoher Biologie ist sehr schwer aber mit der Hilfe habe ich vieles schon verstanden wenn auch etwas vereinfacht. Mir ist dabei viel wichtiger das ganze Konzept dahinter zu verstehen.

Beim Testen der Software habe ich schon viele kleine Fehler entdeckt wobei es schwer ist einen Fehler im Programm von meinen eigenen falschen Eingaben zu unterscheiden.

Am Nachmittag habe ich etwas über Graphalgorithmen gelernt, welche auch bei Schachcomputer angewendet werden. An Beispielen von sozialen Netzwerken wie Facebook wurde mir erklärt wie man die Beziehungen zwischen den einzelnen Personen und ihren Freunden erklären kann. Aber auch wie ein Computer so programmiert wird dass er den schnellsten Weg  zwischen 2 Punkten findet.

Dienstag, 23. April 2013

Mein 2. Tag im Praktikum

Am meinem nun schon 2. Tag im Praktikum wäre ich fast zu spät gekommen da die Bahn zu früh gefahren ist deshalb musste ich 10 min. warten.

An der Uni angekommen hatte ich mein Gespräch mit einem Textminer. Diese schreiben Programme die aus den Texten wichtige Information raussuchen. Die dafür verwendete Software wird mit der Zeit immer besser ,da sie durch Trainingstexte lernt was ist ein Medizinischer Begriff bzw. eine chemische Formel ist.
Damit das Programm jedoch lernt nach welchen Aspekten es suchen muss, werde diese vorher bestimmt ,wobei es egal ist ,ob ich schreibe "das Wort muss 3000 Zeichen haben" oder "das Wort benötigt eine Zahl" ,denn das Programm erlernt durch Trainingstexte selbst welche Kriterien wichtig sind und welche nicht.

Anschließend sollte ich eine selbstgeschriebene Software testen und Fehler mit einem Screenshot und in einem kurzem Text beschreiben und diese als Ticket abschicken. Dies war sehr interessant vorallem da einige Fehler recht merkwürdig waren. Beim Testen sollte ich möglichst jede Funktion in verschiedenen Ausführungen testen. Es klingt einfach doch es gehört auch eine Menge Arbeit dazu

Das war mein nun schon 2.Tag im Praktikum und es macht immer noch alles Spaß und ist spannend.

Freitag, 19. April 2013

Tag 1

Mein erster Tag im Praktikum ist klasse alles läuft super und gibt keinen Stress.
Ich habe mir 1h lang eine Vorlesung auf Englisch angehört. Es gab zwar für mich kaum was zum Verstehen es war jedoch sehr interessant. Dann haben wir für mich ein Serverkonto erstellt ,welches aber eine Stunde braucht bis es freigeschaltet ist.
Das führte zu tierischer Langeweile. Am Ende meines Tages habe ich noch mit meinem Praktikumsbetreuer gesprochen. Er hat mir erklärt was genau alles zur Bioinformatik gehört. Es war super interessant und ich habe viel Neues gelernt jedoch auch altes aufgefrischt und spezifischer erfahren .

Mein Fazit von heute:

Toller erster Tag

Hello World