Tensorflow Lite Posenet Demo APP
การประมาณท่าทางหมายถึงเทคนิคการมองเห็นด้วยคอมพิวเตอร์ที่ตรวจจับรูปร่างมนุษย์ในภาพและวิดีโอเพื่อให้สามารถระบุได้เช่นข้อศอกของใครบางคนปรากฏในภาพใด สิ่งสำคัญคือต้องตระหนักถึงความจริงที่ว่าการประมาณค่าเป็นเพียงการประมาณว่าข้อต่อของร่างกายสำคัญอยู่ที่ใดและไม่สามารถระบุได้ว่าใครอยู่ในภาพหรือวิดีโอ
โมเดล PoseNet ใช้ภาพจากกล้องที่ผ่านการประมวลผลเป็นอินพุตและเอาต์พุตข้อมูลเกี่ยวกับจุดสำคัญ จุดสำคัญที่ตรวจพบจะจัดทำดัชนีโดยรหัสชิ้นส่วนโดยมีคะแนนความเชื่อมั่นระหว่าง 0.0 ถึง 1.0 คะแนนความเชื่อมั่นบ่งบอกถึงความน่าจะเป็นที่มีจุดสำคัญอยู่ในตำแหน่งนั้น
เกณฑ์มาตรฐานประสิทธิภาพ
ประสิทธิภาพจะแตกต่างกันไปตามอุปกรณ์ของคุณและการก้าวออก (แผนที่ความร้อนและเวกเตอร์ออฟเซ็ต) โมเดล PoseNet เป็นขนาดภาพที่ไม่แปรผันซึ่งหมายความว่าสามารถทำนายตำแหน่งโพสต์ในระดับเดียวกับภาพต้นฉบับได้โดยไม่คำนึงว่าภาพจะลดขนาดลงหรือไม่ ซึ่งหมายความว่าคุณกำหนดค่าโมเดลให้มีความแม่นยำสูงขึ้นโดยมีค่าใช้จ่ายในการปฏิบัติงาน
การก้าวออกของเอาต์พุตจะกำหนดว่าเอาต์พุตจะถูกลดขนาดลงเมื่อเทียบกับขนาดภาพอินพุตเท่าใด มีผลต่อขนาดของเลเยอร์และเอาต์พุตของโมเดล
ยิ่งความคืบหน้าของเอาต์พุตสูงขึ้นความละเอียดของเลเยอร์ในเครือข่ายและเอาต์พุตก็จะยิ่งเล็กลงและความแม่นยำของชั้นในเครือข่ายก็จะยิ่งน้อยลงตามไปด้วย ในการนำไปใช้งานนี้การก้าวออกของเอาต์พุตอาจมีค่า 8, 16 หรือ 32 กล่าวอีกนัยหนึ่งคือการก้าวออกเป็น 32 จะทำให้ได้ประสิทธิภาพที่เร็วที่สุด แต่มีความแม่นยำต่ำที่สุดในขณะที่ 8 จะให้ความแม่นยำสูงสุด แต่ประสิทธิภาพที่ช้าที่สุด ค่าเริ่มต้นที่แนะนำคือ 16