Metaday 33: Unterschied zwischen den Versionen

aus Metalab Wiki, dem offenen Zentrum für meta-disziplinäre Magier und technisch-kreative Enthusiasten.
Zur Navigation springenZur Suche springen
 
(11 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 34: Zeile 34:


== Magazinerkennung ==
== Magazinerkennung ==
* Allgemeine Objekterkennung von starren Objekten (ähnlich wie Google Goggles)
* Allgemeine Objekterkennung von starren Objekten (ähnlich wie Google Goggles, nur schneller)
* Zugrundeliegende Technologie und deren Einschränkungen
* Zugrundeliegende Technologie und deren Einschränkungen


== Eye Tracking ==
== Eye Tracking ==
* Demovideo und Aufruf zur Mitarbeit. Es wird ein Aufzeichnungsprogramm zur Verfügung gestellt, mit dem Trainingsdaten für ein aktuell in Entwicklung befindliches Eye-Tracking System erstellt werden können und der aktuelle Stand diskutiert.
* Demovideo und Aufruf zur Mitarbeit. Es wird ein Aufzeichnungsprogramm zur Verfügung gestellt, mit dem Trainingsdaten für ein aktuell in Entwicklung befindliches Eye-Tracking System erstellt werden können. Der aktuelle Stand und die noch problematischen Issues werden diskutiert.
{|
{|
|
|
=== Voraussetzungen ===
=== Voraussetzungen ===


* Installation von OpenCV 2.1 [http://sourceforge.net/projects/opencvlibrary/ Download]
* Installation von OpenCV 2.1 [http://sourceforge.net/projects/opencvlibrary/ Download] Es sollte mindestens ein Capture-Interface installiert sein (V4L, V4L2, VFW, FireWire, ...) und die dazupassenden (USB-)Treibermodule.
* Integrierte oder externe (USB/Firewire) OpenCV-kompatible Webcam (testen mit facedetect ohne Angabe eines Bildes - Erkennung von Gesichtern im Live-Video)
* Integrierte oder externe (USB/Firewire) OpenCV-kompatible Webcam (testen mit facedetect ohne Angabe eines Bildes - Erkennung von Gesichtern im Live-Video)
* Ein Exemplar emedia Nr. 12 vom 18.6. für den Test der Magazinerkennung, Cover siehe rechts. Die Seiten dieses Magazins werden vom Demoprogramm aus Livebildern erkannt. Ein Demoprogramm wird voraussichtlich in den nächsten Tagen bereitgestellt.
* Selbst-Kompilieren von facedetect [[:Media:facedetect.c|facedetect.c]] (minimal verändert vom OpenCV Sample, bitte unsinnige Warnung im Wiki ignorieren), unter Linux via g++ facedetect.c -o facedetect `pkg-config --cflags --libs opencv` . Für Gesichtserkennung ist das Modell haarcascade_frontalface_alt_tree.xml am besten geeignet. Scale bestimmt die Mindestgröße von erkannten Gesichtern (je höher, desto schlechter werden kleine Gesichter erkannt - aber desto schneller ist die Erkennung). Usage: Angabe eines Bildes zur Analyse. Ohne Parameter wird der Live-Test gestartet (scale=6 aus Geschwindigkeitsgründen, d.h. minimale Größe erkannter Gesichter ca. 120x120 pixel)
* Selbst-Kompilieren von facedetect [[:Media:facedetect.c|facedetect.c]] (minimal verändert vom OpenCV Sample, bitte unsinnige Warnung im Wiki ignorieren), unter Linux via g++ facedetect.c -o facedetect `pkg-config --libs opencv` `pkg-config --cflags opencv`. Für Gesichtserkennung ist das Modell haarcascade_frontalface_alt_tree.xml am besten geeignet. Scale bestimmt die Mindestgröße von erkannten Gesichtern (je höher, desto schlechter werden kleine Gesichter erkannt - aber desto schneller ist die Erkennung)
* Ein Exemplar emedia Nr. 12 vom 18.6. für den Test der Magazinerkennung, Cover siehe rechts (ein paar Exemplare werden zur Verfügung gestellt). Die Seiten dieses Magazins werden vom Demoprogramm aus Livebildern erkannt. [http://www.seewald.at/files/MagazinErkennung.zip Demoprogramm 28M]  testKP.c ist genauso zu kompilieren wie facedetect.c, REF muß im aktuellen Verzeichnis sein und beinhaltet ca. 72,000 SURF Keypoints mit Deskriptoren, die aus den 76 Seiten von emedia generiert wurden. Kamera auf die Schulter legen (soweit möglich) und anfangen zu lesen. Erkannte Seiten werden rechts unten im Fenster in Echtzeit angezeigt.
* Nehmen Sie jedenfalls ein komplettes Entwicklungssystem mit, damit wir live etwaige Bugs korrigieren können!
* Nehmen Sie jedenfalls ein komplettes Entwicklungssystem mit, damit wir live etwaige Bugs korrigieren können!
* Bitte auch eigene Bilder mit Gesichtern und Fußgängern mitnehmen (zum Testen der entsprechenden OpenCV-Modelle)
* Bitte auch eigene Bilder mit Gesichtern und Fußgängern mitnehmen (zum Testen der entsprechenden OpenCV-Modelle)
Zeile 60: Zeile 60:
* http://sourceforge.net/projects/opencvlibrary/
* http://sourceforge.net/projects/opencvlibrary/
* '''http://compvis.seewald.at''' Computervision-Crashkurs
* '''http://compvis.seewald.at''' Computervision-Crashkurs
 
* Video zur Magazinerkennung [http://www.youtube.com/watch?v=1QceIPixocw Youtube]


=== Buffet ===
=== Buffet ===
Zeile 74: Zeile 74:
* [[User:bons|bons]]
* [[User:bons|bons]]
* [[User:metaz|meta]]
* [[User:metaz|meta]]
* [[User:Scriptythekid|scripty]]
* [[User:Nex|nex]]
* ...
* ...



Aktuelle Version vom 9. Juli 2010, 14:01 Uhr

Einmal im Monat lädt das Metalab Vortragende aus aller Welt ein, bei uns von ihren Projekten und Ideen zu erzählen. Anschließend gibt es Platz für Lightning Talks, wo Besucher aktuelle Unternehmungen und Vorhaben vorstellen können, sowie ein Buffet und gemütliches Ambiente für Diskussion und Austausch. – Diese Ausgabe weicht jedoch vom gewohnten Konzept ab: statt üblicher Sommerpause gibt es einen hochkarätigen Hands-on Workshop.


Das Metalab lädt herzlich zum Metaday #33 – Summer Edition


am Freitag, den 2. Juli 2010, 19:30 (Beginn 20:00)
im Metalab, Rathausstrasse 6, 1010 Wien – Eintritt frei


OpenCV Crashkurs

Vortragender:    Dr. Alexander K. Seewald
Seewald Solutions
OpenCV ist eine quelloffene, cross-platform Programmbibliothek und enthält Algorithmen für die Bildverarbeitung und maschinelles Sehen. Das CV im Namen steht für Computer Vision.


Zur Person: Dipl.-Ing. Dr.techn. Alexander K. Seewald studierte an der TU Wien Informatik.
Er ist Gründer und Geschäftsführer von Seewald Solutions, die intelligente IT-Lösungen und Dienstleistungen anbietet und sich im Bereich F&E u.a. mit intelligenter Bildverarbeitung, IT-Sicherheit sowie mit neurobiologischer Grundlagenforschung beschäftigt.

Inhalte

Gesichts- und allgemeine Objekterkennung

  • Vortrainierte Modelle für Gesicht (frontal und seitlich) und andere Objekte (Fußgänger etc..) aus OpenCV
  • Zugrundeliegende Technologie, deren Einschränkungen und wie man eigene Modelle trainiert (zB Erkennung lachender/weinender/gelangweilter Gesichter)

Magazinerkennung

  • Allgemeine Objekterkennung von starren Objekten (ähnlich wie Google Goggles, nur schneller)
  • Zugrundeliegende Technologie und deren Einschränkungen

Eye Tracking

  • Demovideo und Aufruf zur Mitarbeit. Es wird ein Aufzeichnungsprogramm zur Verfügung gestellt, mit dem Trainingsdaten für ein aktuell in Entwicklung befindliches Eye-Tracking System erstellt werden können. Der aktuelle Stand und die noch problematischen Issues werden diskutiert.

Voraussetzungen

  • Installation von OpenCV 2.1 Download Es sollte mindestens ein Capture-Interface installiert sein (V4L, V4L2, VFW, FireWire, ...) und die dazupassenden (USB-)Treibermodule.
  • Integrierte oder externe (USB/Firewire) OpenCV-kompatible Webcam (testen mit facedetect ohne Angabe eines Bildes - Erkennung von Gesichtern im Live-Video)
  • Selbst-Kompilieren von facedetect facedetect.c (minimal verändert vom OpenCV Sample, bitte unsinnige Warnung im Wiki ignorieren), unter Linux via g++ facedetect.c -o facedetect `pkg-config --cflags --libs opencv` . Für Gesichtserkennung ist das Modell haarcascade_frontalface_alt_tree.xml am besten geeignet. Scale bestimmt die Mindestgröße von erkannten Gesichtern (je höher, desto schlechter werden kleine Gesichter erkannt - aber desto schneller ist die Erkennung). Usage: Angabe eines Bildes zur Analyse. Ohne Parameter wird der Live-Test gestartet (scale=6 aus Geschwindigkeitsgründen, d.h. minimale Größe erkannter Gesichter ca. 120x120 pixel)
  • Ein Exemplar emedia Nr. 12 vom 18.6. für den Test der Magazinerkennung, Cover siehe rechts (ein paar Exemplare werden zur Verfügung gestellt). Die Seiten dieses Magazins werden vom Demoprogramm aus Livebildern erkannt. Demoprogramm 28M testKP.c ist genauso zu kompilieren wie facedetect.c, REF muß im aktuellen Verzeichnis sein und beinhaltet ca. 72,000 SURF Keypoints mit Deskriptoren, die aus den 76 Seiten von emedia generiert wurden. Kamera auf die Schulter legen (soweit möglich) und anfangen zu lesen. Erkannte Seiten werden rechts unten im Fenster in Echtzeit angezeigt.
  • Nehmen Sie jedenfalls ein komplettes Entwicklungssystem mit, damit wir live etwaige Bugs korrigieren können!
  • Bitte auch eigene Bilder mit Gesichtern und Fußgängern mitnehmen (zum Testen der entsprechenden OpenCV-Modelle)

Die Eye-Tracking Aufnahmesoftware wird nur beim Vortrag zur Verfügung gestellt (Win32, Linux). Die Magazinerkennung-Demo und das facedetect.c Testprogramm werden unter GPL v3 Lizenz zur Verfügung gestellt.

Emedia cover.jpg

Links

Buffet

  • Snacks und ein gut gefüllter Getränkekühlschrank stehen bereit


aktive Teilnehmer