首页
/
每日頭條
/
生活
/
卷積神經網絡識别圖像的基本原理
卷積神經網絡識别圖像的基本原理
更新时间:2025-05-23 02:25:15

在圖像處理任務中,常用拉普拉斯算子對物體邊緣進行提取,拉普拉斯算子為一個大小為3×3的卷積核,中心元素值是8,其餘元素值是−1-1−1

先根據二維卷積算子,構造一個簡單的拉普拉斯算子,并對一張輸入的灰度圖片進行邊緣檢測,提取出目标的外形輪廓。

一、定義一個帶步長和填充的二維卷積算子

# 帶步長和填充的二維卷積算子 import paddle class Conv2D(paddle.nn.Layer): def __init__(self,kernel_size,stride=1,padding=0, weight_attr=paddle.ParamAttr( initializer=paddle.nn.initializer.Constant(value=1.0))): super(Conv2D,self).__init__() self.weight=paddle.create_parameter(shape=[kernel_size,kernel_size], dtype='float32',attr=weight_attr) #步長 self.stride=stride #零填充 self.padding=padding def forward(self,x): new_x=paddle.zeros(shape=[x.shape[0],x.shape[1] 2*self.padding,x.shape[2] 2*self.padding]) new_x[:,self.padding:x.shape[1] self.padding,self.padding:x.shape[2] self.padding]=x u,v=self.weight.shape output_w=int((x.shape[1]-u 2*self.padding)/self.stride 1) output_h=int((x.shape[2]-v 2*self.padding)/self.stride 1) output=paddle.zeros(shape=[x.shape[0],output_w,output_h]) for i in range(output_w): for j in range(output_h): output[:,i,j]=paddle.sum( new_x[:,i*self.stride:i*self.stride u,j*self.stride:j*self.stride v]*self.weight, axis=[1,2]) return output

#測試算子 inputs=paddle.randn([2,8,8]) conv2d_padding=Conv2D(kernel_size=3,padding=1) outputs=conv2d_padding(inputs) print(outputs.shape) conv2d_stride=Conv2D(kernel_size=3,stride=2,padding=1) outputs=conv2d_stride(inputs) print(outputs.shape)

#輸出, #從輸出結果看出,使用3×3大小卷積,padding為1,當stride=1時,模型的輸出特征圖可以與輸入特征圖保持一緻; #當stride=2時,輸出特征圖的寬和高都縮小一倍。 [2, 8, 8] [2, 4, 4]

卷積神經網絡識别圖像的基本原理(97.人工智能使用卷積運算完成圖像邊緣檢測)1

輸出後的長度和寬度計算方式

二、構造一個簡單的拉普拉斯算子,進行圖像邊緣檢測

import matplotlib.pyplot as plt from PIL import Image import numpy as np #讀取圖片灰度圖 img=Image.open("img/catgray.jpg") inputs=np.array(img).astype(np.float32) print(inputs.shape) #設置卷積核 w=np.array([[-1,-1,-1],[-1,8,-1],[-1,-1,-1]],dtype=np.float32) print(w.shape) #創建卷積算子,卷積核為w,步長為1,零填充為1 conv=Conv2D(kernel_size=3,stride=1,padding=1, weight_attr=paddle.ParamAttr(initializer=paddle.nn.initializer.Assign(value=w))) #将圖片轉換為tensor inputs=paddle.to_tensor(inputs) print(inputs.shape) inputs=paddle.unsqueeze(inputs,axis=0) print(inputs.shape) outputs=conv(inputs) outputs=outputs.numpy() print(outputs.shape) #可視化結果 plt.figure(figsize=(8,4)) plt.subplot(121) plt.imshow(img) plt.subplot(122) plt.imshow(outputs.squeeze(),cmap='gray') plt.show()

#輸出的形狀,最後輸出圖像的形狀保持不變 (100, 100) (3, 3) [100, 100] [1, 100, 100] (1, 100, 100)

卷積神經網絡識别圖像的基本原理(97.人工智能使用卷積運算完成圖像邊緣檢測)2

檢測結果

從輸出結果看,使用拉普拉斯算子,目标的邊緣可以成功被檢測出來。

卷積神經網絡識别圖像的基本原理(97.人工智能使用卷積運算完成圖像邊緣檢測)3

卷積神經網絡識别圖像的基本原理(97.人工智能使用卷積運算完成圖像邊緣檢測)4

catgray.jpg

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
批發回來的魚怎麼保鮮
批發回來的魚怎麼保鮮
批發回來的魚怎麼保鮮?蒙眼法買魚時,将一張薄紙用水浸濕,把魚的眼睛蒙上,放人塑料袋中,也不必在塑料袋中裝水,這樣經過一二十分鐘,甚至個把小時,魚也不會死去,把魚帶回家後,放人水中,把蒙在魚眼上的濕紙除去,不多時就會活過來了,我來為大家科普一...
2025-05-23
觀音菩薩挪動位置需要哪些禁忌
觀音菩薩挪動位置需要哪些禁忌
觀音菩薩挪動位置需要哪些禁忌?觀音宜座西向東觀世音菩薩的道場在東海普陀山,所以宜坐西向東,這樣可以與東海的普陀山遙相呼應能夠增加靈氣和福業,下面我們就來聊聊關于觀音菩薩挪動位置需要哪些禁忌?接下來我們就一起去了解一下吧!觀音菩薩挪動位置需要...
2025-05-23
廣東現存麻風病村
廣東現存麻風病村
康複者集中居住點。鐘欣攝康複者集中居住點。鐘欣攝中新網涼山1月23日電題:探訪四川鹽源“麻風村”:那一群從未被遺忘的人作者鄒立楊曹正林記者近日來到四川省涼山州鹽源縣右所鄉塌爾堤村,曾經這個近乎與世隔絕的封閉山村,正發生着天翻地覆的變化,一條...
2025-05-23
兩個人相愛30年為什麼還要分手
兩個人相愛30年為什麼還要分手
曾經聽過一個真實的故事,男孩兒去女孩兒家裡,去見女方的父母,因為當時男孩兒的經濟條件很不好,車房沒有,存款也沒有多少錢,所以,自然而然就遭到了女方父母的反對,并且讓女孩兒迅速的同一個不愛的相親認識的男孩兒定了婚,女孩兒在家呆了有半年,但是在...
2025-05-23
文案套路及技巧
文案套路及技巧
為什麼文案需要技巧?我想,其原因有二:其一,于文案本身來說,文案需要抓人,需要把話說得動聽,技巧就是一種修飾,一把利器;其二,于文案創作者來說,掌握技巧可以提升效率,世間一切技巧莫不如是。之前有在一些文章中提到過某些文案技巧,但多是隻語片言...
2025-05-23
Copyright 2023-2025 - www.tftnews.com All Rights Reserved