Metaday 33: Unterschied zwischen den Versionen
Pk (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
(→Links) |
||
(31 dazwischenliegende Versionen von 11 Benutzern werden nicht angezeigt) | |||
Zeile 6: | Zeile 6: | ||
: am '''Freitag''', den ''' | : am '''Freitag''', den '''2. Juli''' 2010, 19:30 (Beginn '''20:00''')<br /> | ||
: im Metalab, [[Lage|Rathausstrasse 6]], 1010 Wien – Eintritt frei | : im Metalab, [[Lage|Rathausstrasse 6]], 1010 Wien – Eintritt frei | ||
Zeile 19: | Zeile 19: | ||
|} | |} | ||
{|width="600" | {|width="600" | ||
| | | OpenCV ist eine quelloffene, cross-platform Programmbibliothek und enthält Algorithmen für die Bildverarbeitung und maschinelles Sehen. Das CV im Namen steht für Computer Vision. | ||
'''Zur Person:''' ''Dipl.-Ing. Dr.<small>techn.</small> Alexander K. Seewald'' studierte an der TU Wien Informatik.<br />Er ist Gründer und Geschäftsführer von Seewald Solutions, die intelligente IT-Lösungen und Dienstleistungen anbietet und sich im Bereich F&E u.a. mit intelligenter Bildverarbeitung, IT-Sicherheit sowie mit neurobiologischer Grundlagenforschung beschäftigt. | '''Zur Person:''' ''Dipl.-Ing. Dr.<small>techn.</small> Alexander K. Seewald'' studierte an der TU Wien Informatik.<br />Er ist Gründer und Geschäftsführer von Seewald Solutions, die intelligente IT-Lösungen und Dienstleistungen anbietet und sich im Bereich F&E u.a. mit intelligenter Bildverarbeitung, IT-Sicherheit sowie mit neurobiologischer Grundlagenforschung beschäftigt. | ||
|} | |} | ||
Zeile 27: | Zeile 29: | ||
=== Inhalte === | === Inhalte === | ||
== Gesichts- und allgemeine Objekterkennung == | |||
* Vortrainierte Modelle für Gesicht (frontal und seitlich) und andere Objekte (Fußgänger etc..) aus OpenCV | |||
* Zugrundeliegende Technologie, deren Einschränkungen und wie man eigene Modelle trainiert (zB Erkennung lachender/weinender/gelangweilter Gesichter) | |||
* | == Magazinerkennung == | ||
* | * Allgemeine Objekterkennung von starren Objekten (ähnlich wie Google Goggles, nur schneller) | ||
* Zugrundeliegende Technologie und deren Einschränkungen | |||
== Eye Tracking == | |||
* Demovideo und Aufruf zur Mitarbeit. Es wird ein Aufzeichnungsprogramm zur Verfügung gestellt, mit dem Trainingsdaten für ein aktuell in Entwicklung befindliches Eye-Tracking System erstellt werden können. Der aktuelle Stand und die noch problematischen Issues werden diskutiert. | |||
{| | |||
| | |||
=== Voraussetzungen === | |||
* Installation von OpenCV 2.1 [http://sourceforge.net/projects/opencvlibrary/ Download] Es sollte mindestens ein Capture-Interface installiert sein (V4L, V4L2, VFW, FireWire, ...) und die dazupassenden (USB-)Treibermodule. | |||
* Integrierte oder externe (USB/Firewire) OpenCV-kompatible Webcam (testen mit facedetect ohne Angabe eines Bildes - Erkennung von Gesichtern im Live-Video) | |||
* Selbst-Kompilieren von facedetect [[:Media:facedetect.c|facedetect.c]] (minimal verändert vom OpenCV Sample, bitte unsinnige Warnung im Wiki ignorieren), unter Linux via g++ facedetect.c -o facedetect `pkg-config --cflags --libs opencv` . Für Gesichtserkennung ist das Modell haarcascade_frontalface_alt_tree.xml am besten geeignet. Scale bestimmt die Mindestgröße von erkannten Gesichtern (je höher, desto schlechter werden kleine Gesichter erkannt - aber desto schneller ist die Erkennung). Usage: Angabe eines Bildes zur Analyse. Ohne Parameter wird der Live-Test gestartet (scale=6 aus Geschwindigkeitsgründen, d.h. minimale Größe erkannter Gesichter ca. 120x120 pixel) | |||
* Ein Exemplar emedia Nr. 12 vom 18.6. für den Test der Magazinerkennung, Cover siehe rechts (ein paar Exemplare werden zur Verfügung gestellt). Die Seiten dieses Magazins werden vom Demoprogramm aus Livebildern erkannt. [http://www.seewald.at/files/MagazinErkennung.zip Demoprogramm 28M] testKP.c ist genauso zu kompilieren wie facedetect.c, REF muß im aktuellen Verzeichnis sein und beinhaltet ca. 72,000 SURF Keypoints mit Deskriptoren, die aus den 76 Seiten von emedia generiert wurden. Kamera auf die Schulter legen (soweit möglich) und anfangen zu lesen. Erkannte Seiten werden rechts unten im Fenster in Echtzeit angezeigt. | |||
* Nehmen Sie jedenfalls ein komplettes Entwicklungssystem mit, damit wir live etwaige Bugs korrigieren können! | |||
* Bitte auch eigene Bilder mit Gesichtern und Fußgängern mitnehmen (zum Testen der entsprechenden OpenCV-Modelle) | |||
Die Eye-Tracking Aufnahmesoftware wird nur beim Vortrag zur Verfügung gestellt (Win32, Linux). | |||
Die Magazinerkennung-Demo und das facedetect.c Testprogramm werden unter GPL v3 Lizenz zur Verfügung gestellt. | |||
| [[Bild:emedia_cover.jpg|right]] | |||
|} | |||
=== Links === | === Links === | ||
Zeile 43: | Zeile 60: | ||
* http://sourceforge.net/projects/opencvlibrary/ | * http://sourceforge.net/projects/opencvlibrary/ | ||
* '''http://compvis.seewald.at''' Computervision-Crashkurs | * '''http://compvis.seewald.at''' Computervision-Crashkurs | ||
* Video zur Magazinerkennung [http://www.youtube.com/watch?v=1QceIPixocw Youtube] | |||
=== Buffet === | === Buffet === | ||
Zeile 50: | Zeile 67: | ||
=== aktive Teilnehmer === | === aktive Teilnehmer === | ||
* | * michael2 | ||
* [[User:Mzeltner|mzeltner]] | |||
* [[User:oib|oib]] | |||
* [[User:amir|amir]] | |||
* [[User:cygenb0ck|max]] | |||
* [[User:bons|bons]] | |||
* [[User:metaz|meta]] | |||
* [[User:Scriptythekid|scripty]] | |||
* [[User:Nex|nex]] | |||
* ... | * ... | ||
Aktuelle Version vom 9. Juli 2010, 14:01 Uhr
Einmal im Monat lädt das Metalab Vortragende aus aller Welt ein, bei uns von ihren Projekten und Ideen zu erzählen. Anschließend gibt es Platz für Lightning Talks, wo Besucher aktuelle Unternehmungen und Vorhaben vorstellen können, sowie ein Buffet und gemütliches Ambiente für Diskussion und Austausch. – Diese Ausgabe weicht jedoch vom gewohnten Konzept ab: statt üblicher Sommerpause gibt es einen hochkarätigen Hands-on Workshop.
Das Metalab lädt herzlich zum Metaday #33 – Summer Edition
OpenCV Crashkurs
InhalteGesichts- und allgemeine Objekterkennung
Magazinerkennung
Eye Tracking
Links
Buffet
aktive Teilnehmer
|