《圖像時代的早期閲讀》讀書筆記(精選多篇)

讀書筆記
關注：1.07W次

第一篇：《圖像時代的早期閲讀》讀書筆記第二篇：《圖像時代的早期閲讀》讀書筆記第三篇：數字圖像處理讀書筆記第四篇：數字圖像處理讀書筆記第五篇：讀書筆記(圖像和視頻中的不規則檢測)更多相關範文

正文

第一篇：《圖像時代的早期閲讀》讀書筆記

《圖像時代的早期閲讀》書中主要介紹了兒童圖畫書的發展歷程，並介紹了圖像時代的各國著名的早期閲讀讀本，告訴我們怎樣的讀本才是理想的早期閲讀讀本;還講述了早期閲讀的一些活動指導策略，並通過一些案例講述了整合教育理念下的早期閲讀，如有讀本生成的課程、日常生活中的閲讀、親子閲讀、動態圖像閲讀等等。幫助我們能科學地認識不同年齡段孩子的閲讀需求特點，並掌握有效的閲讀指導策略，開展有效的閲讀活動。

在《圖像時代的早期閲讀》一書中，談到早期閲讀的指導方法時，其中有一點給我的體會較深，就是體察童趣，感受童書的神奇魅力。書中介紹了故事《來不及了，來不及了，快要來不及了……》這本繪本充滿了童趣，小男孩急於想上衞生間，從一樓跑到五樓，最終才找到適合自己的衞生間的奇特經歷。作者從孩子的眼光，用幽默的筆觸描寫了一位守規矩、對解手之事很頂真的小男孩，以十分快的熟讀跑到動物展廳的一樓，看門的老伯伯對他説，樓下的衞生間壞了，但從二樓到五樓都有衞生間。可當小男孩跑到二樓時發現是長頸鹿的衞生間，長腿的它們用的小便池好高啊!小男孩只好再往三樓跑，推門進去，發現那是蝙蝠的衞生間，一隻只蝙蝠用奇怪的姿勢倒掛着，小男孩一時懵住了，便槽到底在哪裏?“來不及了，來不及了，快要來不及了……”小男孩邊叨唸邊疾步網四樓跑去，推門進去，哇!怎麼是迷宮似的衞生間啊?這究竟是怎回事?便槽到底在哪兒?小男孩顧不上細想，又一股勁兒地往五樓跑。“來不及了，來不及了，快要來不及了……”當小男孩推門進衞生間，一個個明亮潔淨的便槽出現在眼前。哇——好痛快!小男孩似乎完成了一件大事，他為能堅持找到真正適合自己的衞生間感到滿意極了。該書從語言文字的傳遞到畫面人物動態的刻畫都十分兒童化，情趣十足。笑足之餘，你會為一個認真、可愛的孩子所感動。

圖畫書所散發的美麗除了畫面的精美，更重要的是書中的童趣。那種孩子身上特有的思想感情，那種單純、幼稚可笑的語言、行為和心理活動，實在鄰人着迷，忍俊不禁。

第二篇：《圖像時代的早期閲讀》讀書筆記

《圖像時代的早期閲讀》讀書筆記

在《圖像時代的早期閲讀》一書中，談到早期閲讀的指導方法時，其中有一點給我的體會較深，就是體察童趣，感受童書的神奇魅力。書中介紹了故事《來不及了，來不及了，快要來不及了??》這本繪本充滿了童趣，小男孩急於想上衞生間，從一樓跑到五樓，最終才找到適合自己的衞生間的奇特經歷。作者從孩子的眼光，用幽默的筆觸描寫了一位守規矩、對解手之事很頂真的小男孩，以十分快的熟讀跑到動物展廳的一樓，看門的老伯伯對他説，樓下的衞生間壞了，但從二樓到五樓都有衞生間。可當小男孩跑到二樓時發現是長頸鹿的衞生間，長腿的它們用的小便池好高啊!小男孩只好再往三樓跑，推門進去，發現那是蝙蝠的衞生間，一隻只蝙蝠用奇怪的姿勢倒掛着，小男孩一時懵住了，便槽到底在哪裏?“來不及了，來不及了，快要來不及了??”小男孩邊叨唸邊疾步網四樓跑去，推門進去，哇!怎麼是迷宮似的衞生間啊?這究竟是怎回事?便槽到底在哪兒?小男孩顧不上細想，又一股勁兒地往五樓跑。“來不及了，來不及了，快要來不及了??”當小男孩推門進衞生間，一個個明亮潔淨的便槽出現在眼前。哇——好痛快!小男孩似乎完成了一件大事，他為能堅持找到真正適合自己的衞生間感到滿意極了。該書從語言文字的傳遞到畫面人物動態的刻畫都十分兒童化，情趣十足。笑足之餘，你會為一個認真、可愛的孩子所感動。

第三篇：數字圖像處理讀書筆記

《數字圖象處理》學士論文讀書筆記

運動對象檢測是數字圖像處理技術的一個重要部分，它是計算機視覺、目標識別與跟蹤、運動圖像編碼、基於內容的檢索、安全監控等視頻分析和處理應用的關鍵步驟。解決跟蹤算法的計算量與實時性這對矛盾，是提高系統跟蹤精度和跟蹤穩定性的關鍵，此即為本文的關鍵所在。

對於變化很慢的背景圖像而言，可把動目標看作目標對背景的擾亂，可以看作kalman濾波器在零均值白噪聲時的退化公式：

wt[?i?wp(k)wt]? k(k?1)?p(k?1)

若認為圖像每一個時空點在空間獨立，則以上變量均為標量。即： b(k)p(k?1)?p(k),p(1)?1b(k?1)

這就是説估值的方差隨着測量次數的增加而逐(收藏好範文，請便下次訪問：)漸減小，結果是收斂的，對於圖像，只要系統採樣頻率足夠快，則可以認為背景靜止，所以當圖像序列通過這個低通濾波器時，圖像序列中遂時間緩變的部分就可以分離出來。接着利用圖像和背景進行差分運算，即可從圖像中提取出變化的目標

式中的d(k+1)是去除背景後的當前幀目標圖像。而後，考慮到空間鄰接像素之?(k?1)d(k?1)??(k?1)???(k?1)???(k)?k(k?1)???(k)??(k?1)?w?p(k_?1)?1?[i?k(k?1)w]p(k)

間的相關性，需要進一步對差分圖像數據進行4x4的空間滑動平均濾波以消除輸入圖像中的噪聲影響，然後將以上得到的目標圖的d(k+1) )中每個像素的灰度數據向行和列方向分別投影並且求和，據此計算目標的質心，得到相對飽滿的目標圖像。

該文探討了漸消記憶遞歸最小二乘法在圖像背景重建中的應用，使用簡捷有效的算法結構在複雜背景的條件下分離出了背景和動目標；對圖像在空間域做4~4的滑動平均濾波有效地抑制了於擾噪聲；在求目標的質心時採用等效灰度投影算法，簡化了求質心運算，整體上説算法簡潔，操作方便，基本上解決了引文提出的矛盾。文章研究的運動對象檢測可應用在計算機視覺、目標識別與跟蹤、運動圖像編碼、基於內容的檢索、安全監控等視頻分析和處理應用的關鍵步驟上，如若這種算法得到進一步優化和更新，一定會運用到更多更廣的地方。

通信二班陳陽（10950229）

本文由芬樂網提供

參考文獻

1. 劉永信等《複雜背景圖像中檢測動目標的一種方法》摘自《計算機工程與應用》2014.03

2. 曹炬等《從移動背景紅外序列圖像中檢測運動目標》摘自《電子信息學報》2014.01

3. 何衞華等《複雜背景下基於圖像融合的運動目標輪廓提取算法》摘自《計算機應用》2014.01

第四篇：數字圖像處理讀書筆記

數字圖像處理讀書筆記

本學期的數字圖像處理課程已經進行了3周了，通過這3周的學習讓我對數字圖像處理有了一定的認知和理解。數字圖像處理又稱為計算機圖像處理，它是指將圖像信號轉換成數字信號並利用計算機對其進行處理的過程。這門課程的前三章主要講解了數字圖像的目的、特點、應用和發展，圖像的數字化顯示與圖像變換。

數字圖像處理最早出現於20世紀50年代，當時的電子計算機已經發展到一定水平，人們開始利用計算機來處理圖形和圖像信息。數字圖像處理作為一門學科大約形成於20世紀60年代初期。早期的圖像處理的目的是改善圖像的質量，它以人為對象，以改善人的視覺效果為目的。圖像處理中，輸入的是質量低的圖像，輸出的是改善質量後的圖像，常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。數字圖像處理是通過計算機對圖像進行去除噪聲、增強、復原、分割、提取特徵等處理的方法和技術。數字圖像處理的產生和迅速發展主要受三個因素的影響：一是計算機的發展；二是數學的發展（特別是離散數學理論的創立和完善）;三是廣泛的農牧業、林業、環境、軍事、工業和醫學等方面的應用需求的增長。

一般來講，對圖像進行處理（或加工、分析）的主要目的有三個方面：（1）提高圖像的視感質量，如進行圖像的亮度、彩色變換，增強、抑制某些成分，對圖像進行幾何變換等，以改善圖像的質量。（2）提取圖像中所包含的某些特徵或特殊信息，這些被提取的特徵或信息

往往為計算機分析圖像提供便利。提取特徵或信息的過程是模式識別或計算機視覺的預處理。提取的特徵可以包括很多方面，如頻域特徵、灰度或顏色特徵、邊界特徵、區域特徵、紋理特徵、形狀特徵、拓撲特徵和關係結構等。（3）圖像數據的變換、編碼和壓縮，以便於圖像的存儲和傳輸。不管是何種目的的圖像處理，都需要由計算機和圖像專用設備組成的圖像處理系統對圖像數據進行輸入、加工和輸出。數字圖像處理有以下幾點基本特點：（1）目前，數字圖像處理的信息大多是二維信息，處理信息量很大。如一幅256×256低分辨率黑白圖像，要求約64kbit的數據量；對高分辨率彩色512×512圖像，則要求768kbit數據量；如果要處理30幀/秒的電視圖像序列，則每秒要求500kbit～22.5mbit數據量。因此對計算機的計算速度、存儲容量等要求較高。（2）數字圖像處理佔用的頻帶較寬。與語言信息相比，佔用的頻帶要大幾個數量級。如電視圖像的帶寬約5.6mhz，而語音帶寬僅為4khz左右。所以在成像、傳輸、存儲、處理、顯示等各個環節的實現上，技術難度較大，成本亦高，這就對頻帶壓縮技術提出了更高的要求。（3）數字圖像中各個像素是不獨立的，其相關性大。在圖像畫面上，經常有很多像素有相同或接近的灰度。就電視畫面而言，同一行中相鄰兩個像素或相鄰兩行間的像素，其相關係數可達0.9以上，而相鄰兩幀之間的相關性比幀內相關性一般説還要大些。因此，圖像處理中信息壓縮的潛力很大。（4）由於圖像是三維景物的二維投影，一幅圖象本身不具備復現三維景物的全部幾何信息的能力，很顯然三維景物背後部分信息在二維圖像畫面上是反映不出來

的。因此，要分析和理解三維景物必須作合適的假定或附加新的測量，例如雙目圖像或多視點圖像。在理解三維景物時需要知識導引，這也是人工智能中正在致力解決的知識工程問題。（5）數字圖像處理後的圖像一般是給人觀察和評價的，因此受人的因素影響較大。由於人的視覺系統很複雜，受環境條件、視覺性能、人的情緒愛好以及知識狀況影響很大，作為圖像質量的評價還有待進一步深入的研究。另一方面，計算機視覺是模仿人的視覺，人的感知機理必然影響着計算機視覺的研究。例如，什麼是感知的初始基元，基元是如何組成的，局部與全局感知的關係，優先敏感的結構、屬性和時間特徵等，這些都是心理學和神經心理學正在着力研究的課題。

在數字圖像處理中圖像的數字化顯示是基礎。將模擬圖像轉化成數字圖像的過程就是圖形、圖像的數字化過程。這個過程主要包含採樣、量化和編碼三個步驟。

1．採樣採樣的實質就是要用多少點來描述一幅圖像，採樣結果質量的高低就是用前面所説的圖像分辨率來衡量。簡單來講，對二維空間上連續的圖像在水平和垂直方向上等間距地分割成矩形網狀結構，所形成的微小方格稱為像素點。一副圖像就被採樣成有限個像素點構成的集合。採樣頻率是指一秒鐘內採樣的次數，它反映了採樣點之間的間隔大小。採樣頻率越高，得到的圖像樣本越逼真，圖像的質量越高，但要求的存儲量也越大。在進行採樣時，採樣點間隔大小的選取很重要，它決定了採樣後的圖像能真實地反映原圖像的程度。一般來説，原圖像中的畫面越複雜，色彩越豐富，則採樣間隔應越小。

由於二維圖像的採樣是一維的推廣，根據信號的採樣定理，要從取樣樣本中精確地復原圖像，可得到圖像採樣的奈奎斯特（nyquist）定理：圖像採樣的頻率必須大於或等於源圖像最高頻率分量的兩倍。

2．量化量化是指要使用多大範圍的數值來表示圖像採樣之後的每一個點。量化的結果是圖像能夠容納的顏色總數，它反映了採樣的質量。例如：如果以4位存儲一個點，就表示圖像只能有16種顏色；若採用16位存儲一個點，則有216=65536種顏色。所以，量化位數越來越大，表示圖像可以擁有更多的顏色，自然可以產生更為細緻的圖像效果。但是，也會佔用更大的存儲空間。兩者的基本問題都是視覺效果和存儲空間的取捨。假設有一幅黑白灰度的照片，因為它在水平於垂直方向上的灰度變化都是連續的，都可認為有無數個像素，而且任一點上灰度的取值都是從黑到白可以有無限個可能值。通過沿水平和垂直方向的等間隔採樣可將這幅模擬圖像分解為近似的有限個像素，每個像素的取值代表該像素的灰度（亮度）。對灰度進行量化，使其取值變為有限個可能值。經過這樣採樣和量化得到的一幅空間上表現為離散分佈的有限個像素，灰度取值上表現為有限個離散的可能值的圖像稱為數字圖像。只要水平和垂直方向採樣點數足夠多，量化比特數足夠大，數字圖像的質量就比原始模擬圖像毫不遜色。在量化時所確定的離散取值個數稱為量化級數。為表示量化的色彩值（或亮度值）所需的二進制位數稱為量化字長，一般可用8位、16位、24位或更高的量化字長來表示圖像的顏色；量化字長越大，則越能真實第反映原有的圖像的顏色，但得到的數字圖像的容量也越大。

3．壓縮編碼數字化後得到的圖像數據量十分巨大，必須採用編碼技術來壓縮其信息量。在一定意義上講，編碼壓縮技術是實現圖像傳輸與儲存的關鍵。

數學裏的變換，指一個圖形（或表達式）到另一個圖形（或表達式）的演變。圖象變換是函數的一種作圖方法。已知一個函數的圖象，通過某種或多種連續方式變換，得到另一個與之相關的函數的圖象，這樣的作圖方法叫做圖象變換。

在圖像變換中傅立葉變換就是應用最廣泛的一種變換。數字圖像經二維離散傅立葉變換後，其空間域處理可變換為變換域處理，它具有很多明顯的優點，最突出的是算法運算次數將大大減少，並可採用二維數字濾波技術進行所需要的各種圖像處理。

二位離散餘弦變換其去相關性近似於k-l(karhunen-loeve)最佳變換,算法複雜度適中,易於硬件實現,且具有抗干擾能力強等優點,因此,dct及idct被廣泛應用於h.261、h.263、h.264、jpeg、mpeg等視頻壓縮標準中。

小波分解可以覆蓋整個頻域(提供了一個數學上完備的描述) ；小波變換通過選取合適的濾波器，可以極大的減小或去除所提取得不同特徵之間的相關性；小波變換具有“變焦”特性，在低頻段可用高頻率分辨率和低時間分辨率(寬分析窗口)，在高頻段，可用低頻率分辨率和高時間分辨率(窄分析窗口) ；小波變換實現上有快速算法(mallat小波分解算法)。小波變換是一種信號的時間——尺度分析方法，他具有多分辨率分析的特點，而且在時頻兩域都具有表徵信號

局部特徵的能力，是一種窗口大小固定不變但其形狀可變，時間窗和頻率窗都可變的時頻局部化分析方法。即再低頻部分具有較高的頻率分辨率和時間分辨率，在高頻部分具有較高的時間分辨率和較低的頻率分辨率，很適合探測正常信號中夾帶的瞬態反常現象並展示其成分，所以被譽為分析信號的顯微鏡。

小波變換是一種新的變換分析方法，它繼承和發展了短時傅立葉變換局部化的思想，同時又克服了窗口大小不隨頻率變化等缺點，能夠提供一個隨頻率改變的時間一頻率窗口，是進行信號時頻分析和處理的理想工具。它的主要特點是通過變換能夠充分突出問題某些方面的特徵，因此，小波變換在許多領域都得到了成功的應用，特別是小波變換的離散數字算法已被廣泛用於許多問題的變換研究中。從此，小波變換越來越引起人們的重視，其應用領域來越來越廣泛。

第五篇：讀書筆記(圖像和視頻中的不規則檢測)

論文題目：detecting irregularities in images and in video 所載刊物：international journal of computer vision 74(1), 17–31, 2014 作者：oren boiman and michal irani

主要內容和結論（觀點）：

該文主要闡述了作者在檢測圖像和視頻等可視化數據中的不規則數據的研究成果。

文章中表明，圖像和視頻中不規則圖像模型的探測在各種各樣的任務中都是很有用的。對於監視和監測來説探測可疑行為或是異常目標是重要的。

早先識別可疑行為或活動的方法可以廣泛的被分成兩類：基於規則的方法和沒有預定義規則的統計方法。

而在該文中作者提出將探測規則和不規則的問題公式化成為用從先前可視樣本（數據庫）中提取出來的時空塊組成（解釋）新的觀察的可視數據（一個圖像或是一段視頻，在下面提到時用“查詢”表示）的問題。這些可以用從樣本數據庫中抽取的大的連續數據塊組成的查詢中的區域被認為是相似的，這些區域越大，相似性就越強。在不能用樣本數據庫組成的查詢中的區域被認為是不相似的或是可疑的。作者的方法因此可以從僅僅少量的幾個樣本就能推斷或是歸納出更大的上下文的圖像模式和行為，甚至那些從來都沒有見過的特別構造。（這個過程被定義為“通過組合的推論”）

作者認為該文作出了以下四個主要的貢獻：

1、提出了一個可以從僅有的幾個樣本中就可以推理和歸納的方法，這個方法是關於一個更大的上下文圖像模式和行為的合法性的，甚至是那些從來都沒有見過的特殊構造的合法性。

2、提出了一個基於圖表的貝葉斯定理的推論算法，它可以在成倍增加的時空範圍裏有效探測大的整套的碎片塊（例如，數以百計的碎片塊）。同時它可以增強這些在整體以及單個的描述符上的碎片裏的相關幾何方面的排列上的約束。

3、提出了對圖像和視頻裏術語中的“顯著”和“視覺注意”給出一個新的解釋。

4、提出了一個單一的、統一的框架來處理計算機視覺裏幾個的問題，這些問題在過去已經被單獨地處理過。它們包括：圖像和視頻中值得注意的

地方，可疑行為的識別，異常物體的識別，自動視頻檢查（例如，用於質量保證）等等。

論文中的基本算法：

1、統計公式

用y來表示一個觀察到的查詢範圍內的碎片組合。計算連接的可能性p（x，y），其中觀察到的查詢中的組合y與在數據庫（既在碎片的描述符值相似也在相對位置上相似）中的隱藏的組合x是相似的。我們可以把連接的可能性分解成：p(x, y) = p(y|x)p(x)。

令dy表示觀察到的碎片y中的第i個描述符向量，ly表示它的位置（在絕對座標裏）。類似的，dx表示在碎片x中的第i個隱藏（數據庫）的描述符向量，lx表示它的位置。令cy和cx表示被觀察到的和隱藏的組合的“原始”點。任何這樣一對組合y和x的相似性被以下的可能性公式捕獲： iiii

p(x, y)= p（cx , d1x , . . . , l1x , . . . , cy , d1y , . . . , l1y, . . .）(公式1)

我們用一個高斯分佈在描述符間建立相似性模型：

p（diy|dix） =α1 exp（?1/2（diy? dix）t s d?1（diy? dix））(公式2)

這裏，α1是一個常量，s d是一個常量協方差矩陣，它決定描述符值的可允許的偏差。其它的分佈可以根據其它描述符的相似性函數插入到模型中。給定一個隱藏數據庫碎片的相對位置(lx? cx)，觀察到的相應碎片(ly? cy)的相對位置被假設成不依賴於所有其它碎片位置。這個假設使得有足夠靈活性去適應在視線角度、範圍、位置和行為上的微小變化進行比較兩個碎片組合的幾何排列，這樣： iip（liy | lix, cx , cy）= α2 · exp（? 1/2（（liy? cy） ? （lix? cx））t× s?1l（（liy? cy） ? （lix? cx））））(公式3)

到目前為止我們已經建立了組合（描述符：dy, dx和相應位置：ly? cy , lx? iiiicx）間屬性的關係模型，我們仍然需要建立隱藏組合內的關係（也就是一個碎片描述符dx和它的位置間lx的關係）模型。利用數據庫中的樣本進行非參數化的為它建模：

1(dx , lx ) ∈ database

p (dx | lx ) =(公式4）

0otherwise

這裏dx和lx是任意描述符和位置。

這樣，對於一個觀察到的組合y和一個隱藏數據庫組合x，我們可以通過利用公式(2)–(4)來得出公式(1)的共同可能性p(x, y) 如下：

p（cx , d1x , . . . , l1x , . . . , cy , d1y , . . . , l1y）

=α?p（liy| lix, cx , cy）p（diy| dix）p（dix| lix）(公式5)

對於任何隱藏的非零可能性的集團分配,我們定義組合代價為負的對數可能性函數：

-logp（cx , d1x , . . . , l1x , . . . , cy , d1y , . . . , l1y）

= ?i-log p（liy| lix, cx , cy）+?-log p（diy| dix）+α1(公式6) i

當α1= log (α)時是常量。

2、信任傳播推論

給定一個觀察到的組合，我們尋找一個隱藏的數據庫組合，這個組合最大化它的map（最大歸納的可能性）分配。這被通過上面統計模型來完成，這個模型具有一個簡單並且確切的信任傳播運算法則。根據公式(5)， map分配可以被寫成：

1111p（c , d , . . . , l , . . . , c , d , . . . , lxxxyyy） maxx

=α?iiiiiiip（l| l, c , c）p（d| d）p（d| ly xxyy xx x）(公式7) maxmaxlxidxi

首先我們為每一個碎片計算從結點dx到結點lx關於它在位置lx的信任消息： iii

midl（lix） = iii ip（d| d）p（d| ly xx x）(公式8) maxdxi

也就是，對於每一個觀察到的碎片，用高描述符相似性計算每一個候選數據

庫位置lx。下一步，對這些候選數據庫的每一個位置，我們都傳遞一個包含在數據庫中可能原始位置cx： i

milc(cx) = iiip（l| l, c, c）m（ly xx ydlx）(公式9) maxlxi

在這一點，我們有一個被每一個碎片暗示的候選原始列表。為了計算一個整體組合任務的可能性，我們從組合裏的所有個體碎片中乘這信任：

mc (cx ) =?milc (cx )(公式10)

通過這個運算法則處理的推論運算量一個map推論。

3、估算查詢點的可能性

對於查詢中每一個點，我們嘗試在它周圍組合一個大的區域。這可以通過檢查圍繞着每一個點的大區域的有效性，檢查時用上面的推論處理過程（通過計算一個查詢區域相似性）。這一點參與了很多查詢區域中。我們定義一個查詢點的相似性為包含那個點的最大區域可能性。因此，假如存在一個包含它的大區域，有相應的相似性數據庫區域的話，在查詢中的一個點將有一個高可能性。這樣，我們可以利用部份的目標遮擋組合成查詢，因為靠近邊界的點被包含在目標裏的一個大的區域中。然而，部分遮擋可能生成小的鄰接的目標區域，這些區域不能用我們當前推論算法去組合。

在文章中，作者還提出了算法的性能改進，並介紹了一些基於該文中所述方法的探測圖像和視頻中不規則方面的應用：包括探測異常圖像構造、單一圖像的顯著空間、探測可疑行為以及自動視頻檢查（質量保證）等等。

最後，文章給出了結論：“通過組合的推論”，允許我們可以由少數幾個樣例就能在一個更大的上下文中去歸納什麼是規則的，什麼是不規則的。這個壓縮過程的實現是作為一個概率圖像模型裏的高效推論算法來完成的，它適應查詢與數據庫之間微小的時空變形。

“通過組合的推論”，也可以應用在完全沒有任何早先樣本的情況下探測可視數據的顯著性。為了這個目的我們把每一個圖像區域稱作一個“查詢”，並且盡力利用剩下部分的圖像（數據庫）去組合它。這個過程依次重複所有的圖像區域。像這樣一些不能用圖像的其它部分“解釋”（組合）的區域將作為顯著區域

被探測出來。這導致了在可視數據上的一個新定義的術語：顯著。在視頻數據的案例中，這些區域是時空相關的，並且這些顯著的視頻區域是與顯著的行為相呼應的。

“通過組合的推論”，這一方法是通用的並且因此能夠研究在一個單一的、統一的框架裏的問題，它的一般性使得它不用採取任何基於分類模型的預學習的方法。我們通過探測可疑行為，顯著行為，顯著圖像區域，探測貨物或產品來證明這個方法的應用。

文章中也提到，該文中的算法有兩個主要的侷限性：(i)儘管遮擋可以處理某種程度的影響，它不能處理一些極端的遮擋（例如當只有物體的小碎片部分是顯著時）。(ii)時間和存儲的複雜度在該文的推論算法中是隨樣本數據庫的大小顯線性變化的。這對於大的數據庫來説顯然是有問題的。這兩個問題會是作者將來研究的一個主題。

相關研究介紹:

趙峯等人在《計算機研究與發展》中發表的《一種基於奇異值分解的圖像匹配算法》提出一種新的基於奇異值分解的圖像匹配算法。首先在待匹配圖像中分別提取帶主方向的角點作為特徵點，通過計算特徵點間經旋轉補償的歸一化互相關值建立特徵點相似度矩陣，然後利用奇異值分解算法生成特徵點匹配矩陣並獲得特徵點間的--對應關係。在複雜自然圖像上的實驗結果表明，算法能夠匹配任意角度旋轉的圖像，對局部遮擋、光照變化、隨機噪聲等具有較強的健壯性，並具有較快的計算速度和較高的匹配精度。

張軍、劉志鏡在《模式識別與人工智能》發表的《基於模糊理論的行人異常動作檢測》中根據行人軀幹和四肢輪廓角度的變化，設計用於模糊化的函數式。提出利用軀幹和四肢的模糊隸屬度通過計算來得到整個人異常度的一種基於模糊理論異常行為判別的算法。在系統實現中，提出利用質心軌跡和模糊判別的聯合方法來甄別行人是否異常的方法。模糊判別可實現在視頻監控範圍內對行人行為的主動分析，從而能夠對行人異常的動作做出識別並進行報警處理。

田永鴻等人申請的專利201410568248.x，“圖像顯著對象提取方法、互補顯著度圖學習方法及系統”，通過給定任意圖像，自動準確地提取出圖像中的顯著物體，有效地解決了在複雜場景下一般顯著物體提取結果缺乏的準確性和魯棒性問題。

sdong小編推薦更多文章：

《獲利時代》讀書筆記

《小時代》讀書筆記

《鄧小平時代》讀書筆記

小時代讀書筆記

《時代》雜誌閲讀筆記 (2)

標籤：讀書筆記多篇圖像精選早期

文章版權屬於文章作者所有，轉載請註明 https://wenfanwang.com/xindetihui/dushu/1dj9w.html

當前位置：文範網 >

心得體會 >讀書筆記 >

《圖像時代的早期閲讀》讀書筆記(精選多篇)

相關內容

熱門文章

猜你喜歡