aus Metalab Wiki, dem offenen Zentrum für meta-disziplinäre Magier und technisch-kreative Enthusiasten.
|
|
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt) |
Zeile 60: |
Zeile 60: |
| * http://sourceforge.net/projects/opencvlibrary/ | | * http://sourceforge.net/projects/opencvlibrary/ |
| * '''http://compvis.seewald.at''' Computervision-Crashkurs | | * '''http://compvis.seewald.at''' Computervision-Crashkurs |
− | | + | * Video zur Magazinerkennung [http://www.youtube.com/watch?v=1QceIPixocw Youtube] |
| | | |
| === Buffet === | | === Buffet === |
Zeile 75: |
Zeile 75: |
| * [[User:metaz|meta]] | | * [[User:metaz|meta]] |
| * [[User:Scriptythekid|scripty]] | | * [[User:Scriptythekid|scripty]] |
| + | * [[User:Nex|nex]] |
| * ... | | * ... |
| | | |
Aktuelle Version vom 9. Juli 2010, 14:01 Uhr
Einmal im Monat lädt das Metalab Vortragende aus aller Welt ein, bei uns von ihren Projekten und Ideen zu erzählen. Anschließend gibt es Platz für Lightning Talks, wo Besucher aktuelle Unternehmungen und Vorhaben vorstellen können, sowie ein Buffet und gemütliches Ambiente für Diskussion und Austausch. – Diese Ausgabe weicht jedoch vom gewohnten Konzept ab: statt üblicher Sommerpause gibt es einen hochkarätigen Hands-on Workshop.
Das Metalab lädt herzlich zum Metaday #33 – Summer Edition
- am Freitag, den 2. Juli 2010, 19:30 (Beginn 20:00)
- im Metalab, Rathausstrasse 6, 1010 Wien – Eintritt frei
OpenCV Crashkurs
OpenCV ist eine quelloffene, cross-platform Programmbibliothek und enthält Algorithmen für die Bildverarbeitung und maschinelles Sehen. Das CV im Namen steht für Computer Vision.
Zur Person: Dipl.-Ing. Dr.techn. Alexander K. Seewald studierte an der TU Wien Informatik. Er ist Gründer und Geschäftsführer von Seewald Solutions, die intelligente IT-Lösungen und Dienstleistungen anbietet und sich im Bereich F&E u.a. mit intelligenter Bildverarbeitung, IT-Sicherheit sowie mit neurobiologischer Grundlagenforschung beschäftigt.
|
Inhalte
Gesichts- und allgemeine Objekterkennung
- Vortrainierte Modelle für Gesicht (frontal und seitlich) und andere Objekte (Fußgänger etc..) aus OpenCV
- Zugrundeliegende Technologie, deren Einschränkungen und wie man eigene Modelle trainiert (zB Erkennung lachender/weinender/gelangweilter Gesichter)
Magazinerkennung
- Allgemeine Objekterkennung von starren Objekten (ähnlich wie Google Goggles, nur schneller)
- Zugrundeliegende Technologie und deren Einschränkungen
Eye Tracking
- Demovideo und Aufruf zur Mitarbeit. Es wird ein Aufzeichnungsprogramm zur Verfügung gestellt, mit dem Trainingsdaten für ein aktuell in Entwicklung befindliches Eye-Tracking System erstellt werden können. Der aktuelle Stand und die noch problematischen Issues werden diskutiert.
Voraussetzungen
- Installation von OpenCV 2.1 Download Es sollte mindestens ein Capture-Interface installiert sein (V4L, V4L2, VFW, FireWire, ...) und die dazupassenden (USB-)Treibermodule.
- Integrierte oder externe (USB/Firewire) OpenCV-kompatible Webcam (testen mit facedetect ohne Angabe eines Bildes - Erkennung von Gesichtern im Live-Video)
- Selbst-Kompilieren von facedetect facedetect.c (minimal verändert vom OpenCV Sample, bitte unsinnige Warnung im Wiki ignorieren), unter Linux via g++ facedetect.c -o facedetect `pkg-config --cflags --libs opencv` . Für Gesichtserkennung ist das Modell haarcascade_frontalface_alt_tree.xml am besten geeignet. Scale bestimmt die Mindestgröße von erkannten Gesichtern (je höher, desto schlechter werden kleine Gesichter erkannt - aber desto schneller ist die Erkennung). Usage: Angabe eines Bildes zur Analyse. Ohne Parameter wird der Live-Test gestartet (scale=6 aus Geschwindigkeitsgründen, d.h. minimale Größe erkannter Gesichter ca. 120x120 pixel)
- Ein Exemplar emedia Nr. 12 vom 18.6. für den Test der Magazinerkennung, Cover siehe rechts (ein paar Exemplare werden zur Verfügung gestellt). Die Seiten dieses Magazins werden vom Demoprogramm aus Livebildern erkannt. Demoprogramm 28M testKP.c ist genauso zu kompilieren wie facedetect.c, REF muß im aktuellen Verzeichnis sein und beinhaltet ca. 72,000 SURF Keypoints mit Deskriptoren, die aus den 76 Seiten von emedia generiert wurden. Kamera auf die Schulter legen (soweit möglich) und anfangen zu lesen. Erkannte Seiten werden rechts unten im Fenster in Echtzeit angezeigt.
- Nehmen Sie jedenfalls ein komplettes Entwicklungssystem mit, damit wir live etwaige Bugs korrigieren können!
- Bitte auch eigene Bilder mit Gesichtern und Fußgängern mitnehmen (zum Testen der entsprechenden OpenCV-Modelle)
Die Eye-Tracking Aufnahmesoftware wird nur beim Vortrag zur Verfügung gestellt (Win32, Linux).
Die Magazinerkennung-Demo und das facedetect.c Testprogramm werden unter GPL v3 Lizenz zur Verfügung gestellt.
|
|
Links
Buffet
- Snacks und ein gut gefüllter Getränkekühlschrank stehen bereit
aktive Teilnehmer
|
|