- 1.安裝Open Cv4
- 2.幾個(gè)示例程序帶你了解OpenCV
- 3.認(rèn)識(shí)Mat容器
- 4.Mat類數(shù)據(jù)的讀取
- 5.Mat支持的運(yùn)算
- 6.圖像讀取、顯示與保存
- 7.Image Watch的使用
- 8.視頻加載與攝像頭使用
- 9.圖像顏色空間變換
- 10.多通道分離與合并
- 11.兩張圖像像素比較
- 12.圖像像素邏輯操作
- 13.圖像二值化
- 14.LUT 查找表
- 15.圖像尺寸變換
- 16.圖像仿射變換
- 17.圖像透視變換
- 18.圖像中繪制基礎(chǔ)圖形
- 19.ROI區(qū)域截取
- 20.高斯圖像金字塔
- 21.拉普拉斯圖像金字塔
- 22.創(chuàng)建滑動(dòng)條
- 23.鼠標(biāo)事件響應(yīng)
- 24..圖像直方圖繪制
- 25.直方圖均衡化
- 26.直方圖匹配
- 27.模板匹配
- 28.圖像卷積
- 29.圖像噪聲的產(chǎn)生
- 30.線性濾波
- 31.非線性濾波——中值濾波
- 32.可分離濾波
- 33.邊緣檢測(cè)(一)
- 34.邊緣檢測(cè)(二)
- 35.連通域分析
- 36.圖像距離變換
- 37.形態(tài)學(xué)操作——腐蝕
- 38.形態(tài)學(xué)操作——膨脹
- 39.形態(tài)學(xué)應(yīng)用
- 40.圖像細(xì)化
- 41.輪廓檢測(cè)
- 42.輪廓信息統(tǒng)計(jì)
- 43.輪廓外接多邊形
- 44.凸包檢測(cè)
- 45.直線檢測(cè)
- 46.點(diǎn)集擬合
- 47.二維碼檢測(cè)
- 48.積分圖像
- 49.圖像分割——漫水填充
- 50.圖像分割——分水嶺法
- 51.Harris角點(diǎn)檢測(cè)
- 52.Shi-Tomas角點(diǎn)檢測(cè)
- 53.亞像素級(jí)別角點(diǎn)位置優(yōu)化
- 54.ORB特征點(diǎn)
- 55.特征點(diǎn)匹配
- 56.RANSAC優(yōu)化特征點(diǎn)匹配
- 57.相機(jī)模型與投影
- 58.單目相機(jī)標(biāo)定
- 59.圖像校正
- 60.單目位姿估計(jì)
- 61.差值法檢測(cè)移動(dòng)物體
- 62.稠密光流法跟蹤移動(dòng)物體
- 63.稀疏光流法跟中移動(dòng)物體
- 64.監(jiān)督學(xué)習(xí)聚類
- 65.K均值聚類
- 66.加載深度神經(jīng)網(wǎng)絡(luò)模型
- 67.深度神經(jīng)網(wǎng)絡(luò)模型的使用
計(jì)算機(jī)視覺顧名思義就是讓計(jì)算機(jī)或者其他電子設(shè)備具有類似人類的視覺系統(tǒng),可以通過采集的圖片或視頻進(jìn)行處理,從而獲得場(chǎng)景或事物的三維信息,并進(jìn)行識(shí)別判斷。
人臉識(shí)別、手勢(shì)解鎖、以圖搜圖、無(wú)人駕駛、AI醫(yī)療……以計(jì)算機(jī)視覺為代表的人工智能在各行各業(yè)大放異彩,在很多領(lǐng)域都取得了超過人類專家的水平。達(dá)爾聞項(xiàng)目實(shí)戰(zhàn)系列第4季由TE獨(dú)家冠名——
什么是計(jì)算機(jī)視覺?
Computer Vision是一個(gè)工作場(chǎng)所,可讓我們以數(shù)字方式檢測(cè)圖像并對(duì)這些圖像執(zhí)行操作。Computer Vision是一個(gè)人工智能工作區(qū),在這里我們可以通過訪問數(shù)字媒體中的圖像特征來(lái)收集信息并提取特征。在其他來(lái)源中,其定義如下:
維基百科:
計(jì)算機(jī)視覺是一門跨學(xué)科的科學(xué)領(lǐng)域,涉及計(jì)算機(jī)如何從數(shù)字圖像或視頻中獲得高級(jí)了解。從工程學(xué)的角度來(lái)看,它試圖理解和自動(dòng)化人類視覺系統(tǒng)可以完成的任務(wù)。
IBM:
計(jì)算機(jī)視覺是人工智能(AI)的領(lǐng)域,它使計(jì)算機(jī)和系統(tǒng)能夠從數(shù)字圖像,視頻和其他視覺輸入中獲取有意義的信息,并根據(jù)該信息采取行動(dòng)或提出建議。如果AI使計(jì)算機(jī)能夠思考,則計(jì)算機(jī)視覺使他們能夠看到,觀察和理解。
計(jì)算機(jī)視覺的主要目的是理解圖像并解釋它們以供我們使用。作為人類,我們可以用眼睛輕松感知任何街道上的移動(dòng)物體。計(jì)算機(jī)使用許多不同的算法來(lái)理解這一點(diǎn)。但是,使用這些算法,計(jì)算機(jī)可能仍無(wú)法給出非常高精度的結(jié)果。
資源:https : //manningbooks.medium.com/how-does-computer-vision-work-bc35b0fb5df5
計(jì)算機(jī)視覺如何工作?
計(jì)算機(jī)使用某些算法來(lái)檢測(cè)數(shù)字媒體中的圖像。數(shù)字媒體中的圖像由像素組成。任何圖像中的像素都具有顏色和坐標(biāo)。
想象一下,每個(gè)像素都有自己的標(biāo)識(shí)。在其ID上,它寫入坐標(biāo)和顏色信息。這是計(jì)算機(jī)可以檢測(cè)和識(shí)別圖像的方式。
像素的坐標(biāo)和顏色信息用數(shù)字表示。數(shù)字是根據(jù)RGB格式定義的。由于圖像身份中的此信息是用數(shù)字表示的,因此計(jì)算機(jī)可以理解這一點(diǎn)。
每個(gè)圖像可以包含數(shù)千個(gè)像素。這些像素也作為矩陣保留在圖像上。因此,如果我們要在視覺上進(jìn)行操作,則需要通過矩陣進(jìn)行操作。
計(jì)算機(jī)視覺分為三個(gè)基本步驟:
1.獲取圖像
可以通過視頻,照片或3D技術(shù)實(shí)時(shí)獲取甚至大集合的圖像進(jìn)行分析。
2.處理圖像
深度學(xué)習(xí)模型會(huì)自動(dòng)執(zhí)行此過程的大部分過程,但是通常會(huì)先向模型提供數(shù)千張標(biāo)記或預(yù)先識(shí)別的圖像,然后對(duì)模型進(jìn)行訓(xùn)練。
3.了解圖像
最后一步是解釋性步驟,在此步驟中對(duì)對(duì)象進(jìn)行識(shí)別或分類。
資源:https://www.weareworldquant.com/en/thought-leadership/understanding-images-computer-vision-in-flux/
計(jì)算機(jī)視覺的應(yīng)用
最受歡迎的計(jì)算機(jī)視覺應(yīng)用程序的示例:
癌癥檢測(cè)
COVID-19診斷
口罩檢測(cè)
車輛分類
交通流量分析
停車占用檢測(cè)
自動(dòng)車牌識(shí)別
客戶追蹤
人數(shù)盤點(diǎn)
社會(huì)距離
球追蹤
球門線技術(shù)
什么是OpenCV?
OpenCV,即開源計(jì)算機(jī)視覺庫(kù)。可以理解,它是一個(gè)開放源代碼的計(jì)算機(jī)視覺庫(kù)。如今,它在圖像處理領(lǐng)域非常流行。你可以使用Java,C ++或Python語(yǔ)言在OpenCV上工作。
通過使用OpenCV,人們可以處理圖像和視頻以識(shí)別對(duì)象,面部,甚至是人的筆跡。當(dāng)它與各種庫(kù)(例如Numpy)集成時(shí),python能夠處理OpenCV數(shù)組結(jié)構(gòu)以進(jìn)行分析。
為了識(shí)別圖像模式及其各種特征,我們使用向量空間并對(duì)這些特征執(zhí)行數(shù)學(xué)運(yùn)算。
OpenCV的簡(jiǎn)史
OpenCV由加里·布拉德斯基(Gary Bradsky)于1999年在英特爾創(chuàng)立,第一版于2000年問世。瓦迪姆·皮薩列夫斯基(Vadim Pisarevsky)與加里·布拉德斯基(Gary Bradsky)一起管理英特爾的俄羅斯軟件OpenCV團(tuán)隊(duì)。
2005年,OpenCV用于Stanley,該車贏得了2005年DARPA大挑戰(zhàn)賽的冠軍。后來(lái),在Willow Garage的支持下,它的發(fā)展得以繼續(xù),Gary Bradsky和Vadim Pisarevsky領(lǐng)導(dǎo)了該項(xiàng)目。OpenCV現(xiàn)在支持與計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)有關(guān)的多種算法,并且正在日益擴(kuò)展。
OpenCV支持多種編程語(yǔ)言,例如C ++,Python,Java等,并且可在包括Windows,Linux,OS X,Android和iOS在內(nèi)的不同平臺(tái)上使用。基于CUDA和OpenCL的高速GPU操作的接口也正在積極開發(fā)中。
OpenCV-Python是用于OpenCV的Python API,結(jié)合了OpenCV C ++ API的最佳質(zhì)量和Python語(yǔ)言。
OpenCV快速入門
在討論了計(jì)算機(jī)視覺和OpenCV之后,我想向你展示我們可以使用一些簡(jiǎn)單的應(yīng)用程序來(lái)做些什么。這樣,你既可以練習(xí)得更好,又可以進(jìn)入學(xué)習(xí)過程。
讀取圖像
首先,我們將使用OpenCV進(jìn)行讀取圖像并將其顯示在屏幕上的過程。如果在使用Python的IDE中未安裝OpenCV,則必須先安裝它。
pip install opencv-python
安裝之后,首先,你必須導(dǎo)入庫(kù)。你可以將OpenCV庫(kù)稱為cv2。
你需要將要讀取的圖像保存到對(duì)象中。
你可以使用cv2.imread( )函數(shù)讀取圖像。此函數(shù)將獲取圖像的文件的路徑作為參數(shù)。由于我的python工作文件與位于同一文件夾中,因此我直接輸入的名稱。這里要注意的一點(diǎn)是編寫視覺效果的擴(kuò)展。別忘了這個(gè)。
當(dāng)我們運(yùn)行代碼時(shí),我們給該窗口命名,因?yàn)樗鼘⒃诳梢暣翱谥写蜷_。我們使用cv2.namedWindow( ).函數(shù)執(zhí)行此操作。該函數(shù)將窗口的名稱作為其第一個(gè)參數(shù)。實(shí)際上,這就足夠了。但是由于我希望能夠更改打開的窗口的大小,因此我添加了參數(shù)cv2.WINDOW_NORMAL.
代碼運(yùn)行時(shí),函數(shù)cv2.imshow( )用于在屏幕上顯示當(dāng)前圖像。它有兩個(gè)參數(shù)。第一個(gè)是我們將要顯示的視覺效果的名稱,第二個(gè)是它在其中注冊(cè)的對(duì)象。在這里,我將圖像保存為img。因此,我將img用作第二個(gè)參數(shù)。
最后,我編寫該函數(shù)cv2.waitKey(0)是因?yàn)橄M诖蜷_的可視屏幕上隨時(shí)關(guān)閉它。此函數(shù)以毫秒為單位獲取數(shù)字值。當(dāng)我們?cè)诖颂帉懭?時(shí),表示我們可以隨時(shí)關(guān)閉窗口。
另外,養(yǎng)成添加函數(shù)cv2.destroyAllWindows().的習(xí)慣。當(dāng)我們執(zhí)行高級(jí)項(xiàng)目時(shí),我們會(huì)忘記關(guān)閉許多在屏幕上打開的窗口。此函數(shù)可避免這種情況。
你可以在下面找到所有代碼。
import cv2
img = cv2.imread("klon.jpg")
cv2.namedWindow("Image",cv2.WINDOW_NORMAL)
cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()
從網(wǎng)絡(luò)攝像頭讀取視頻
現(xiàn)在,讓我們檢查一下如何從計(jì)算機(jī)攝像機(jī)讀取視頻。
首先,我們導(dǎo)入OpenCV庫(kù)。
然后,我們將從計(jì)算機(jī)攝像機(jī)拍攝的圖像寫在一個(gè)物體上。我將此對(duì)象設(shè)置為捕獲。我們使用cv2.VideoCapture(0)函數(shù)從計(jì)算機(jī)攝像頭捕獲視頻。此處的值0用于訪問連接到計(jì)算機(jī)的相機(jī)。
如果你有攝像機(jī),則可以將其設(shè)為0。如果你有更多攝像機(jī),則可以嘗試1,2 ..訪問相應(yīng)的攝像機(jī)。
如你所知,視頻由幀組成。為了查看我們?cè)谝曨l中捕獲的圖像,我們必須將它們循環(huán)打印在屏幕上。因此,我們進(jìn)行了定義,將讀取捕獲的圖像,然后將該圖像返回給我們。
ret, frame = capture.read()
然后我們進(jìn)行調(diào)整。要在鏡中看到自己看到的捕獲圖像,我們需要將它們反轉(zhuǎn)為y軸。這就是為什么我們?cè)趂rame = cv2.flip(frame, 1).此處編寫代碼的原因,當(dāng)我們?cè)趲筝斎雲(yún)?shù)為1時(shí),它給出了y軸圖像的倒數(shù)。
然后,我們編寫代碼cv2.imshow("Webcam", frame)以顯示從相機(jī)拍攝的幀。
然后,我們確定捕獲的圖像將在屏幕上保留幾毫秒。除此之外,當(dāng)我們按下鍵盤上的q鍵時(shí),我們將編寫以下代碼以停止接收?qǐng)D像。
cv2.imshow("Webcam", frame)
if cv2.waitKey(30) & 0xFF == ord("q"):
break
在此,0xFF == ord("q")是指按鍵盤上的q鍵。
最后,在處理完視頻之后,完成后,我們需要編寫一些代碼來(lái)發(fā)布圖像。如下。
capture.release()
你可以在下面找到所有代碼。
import cv2
capture = cv2.VideoCapture(0)
while True:
ret, frame = capture.read()
frame = cv2.flip(frame, 1)
cv2.imshow("Webcam", frame)
if cv2.waitKey(30) & 0xFF == ord("q"):
break
capture.release()
cv2.destroyAllWindows()
長(zhǎng)寬比應(yīng)用
現(xiàn)在,我將向你展示一個(gè)長(zhǎng)寬比應(yīng)用程序。在某些情況下,我們可能不知道圖像的尺寸。在這種情況下,可以通過避免手動(dòng)計(jì)算來(lái)使用此類應(yīng)用程序來(lái)實(shí)現(xiàn)此目的的自動(dòng)化。
我們定義了一個(gè)名為resizewithAspectRatio的函數(shù)。我們?yōu)榇撕瘮?shù)設(shè)置了4個(gè)參數(shù)。這些是:
為其保留圖像的變量的名稱
寬度
高度
并具有避免在調(diào)整大小時(shí)插值的功能
讓我們繼續(xù)執(zhí)行要應(yīng)用的步驟。
首先,我們定義一個(gè)維變量,其預(yù)定義為空。然后,將原始尺寸中圖像的前兩個(gè)尺寸分別作為高度和寬度的h和w保存到一個(gè)元組中。
如果未指定寬度和高度,則我們希望圖像返回其原始狀態(tài)。
如果未指定寬度,我們希望執(zhí)行以下操作。
