智能小程序為開發者提供對接百度搜索生態的能力,為智能小程序導入搜索流量,旨在打造更加開放、互聯互通的小程序生態。具體操作詳見接入自然搜索。
搜索流量接入
當用戶在百度 App(10.10或以上版本)中搜索對應的智能小程序的相關內容時,小程序的相關頁面會被檢索并出現在搜索結果頁中。自然搜索能夠滿足用戶對于智能小程序內的服務和信息的精準搜索需求。對于開發者來說,自然搜索能夠把自己的詳細服務或信息與用戶的需求做精準匹配,完成用戶的深度轉化。
流量政策
小程序優待:同質內容情況下,搜索會優先展現智能小程序頁面;②小程序標記:智能小程序結果已接入百度搜索,會通過“小程序”標記提示C端用戶,強化小程序品牌、吸引用戶點擊。
自然結果介紹:在搜索自然結果中,小程序內容被收錄之后可以在自然結果中獲得展示。當智能小程序某頁面被用戶檢索到,其展現形式會有小程序標簽,用戶在百度App(10.10或以上版本)點擊該條搜索結果,即可打開智能小程序。開發者只需要進行簡單的配置工作,就可以使自己開發的智能小程序被百度搜索收錄、分發。
收錄
智能小程序被搜索引擎收錄的前提是web化。被百度搜索引擎收錄的前提是可被爬蟲發現和抓取,由于智能小程序運行在app 中,無法被爬蟲感知,所以需要對智能小程序進行 web 化的處理(在開發工具中開啟 web 化功能后發布小程序即可完成 web 化小程序版本的生成),web 化處理之后的智能小程序可以在瀏覽器中獨立運行,像普通網頁一樣被爬蟲抓取頁面數據。
分發
當智能小程序被搜索引擎正常收錄后,在百度搜索結果頁中開發者原 H5 站會替換為智能小程序的對應頁面。對于沒有原 H5 站的智能小程序,同時也可以在百度完成新增內容的收錄和分發。點此進行接入申請。
目前智能小程序在百度搜索生態中進行分發有自然搜索和阿拉丁特型卡片兩種形式。
自然搜索
在百度搜索結果頁中,當智能小程序某頁面被正常檢索到,其展現形式和普通網頁相同,用戶在百度App(10.9.5或以上版本)點擊該條搜索結果,即可打開智能小程序。
如在百度App搜索框中輸入“南開大學 貼吧”,在召回的自然搜索中,點擊百度貼吧相關的搜索結果,即可打開百度貼吧智能小程序,并進入“南開大學吧”主頁。
阿拉丁特型卡片
相比于自然搜索,阿拉丁卡片的樣式更加豐富,用戶可以通過卡片進行簡單的交互,填寫相關的信息,并最終打開智能小程序的相關頁面。
如在百度App中搜索框輸入“查違章”,可以在搜索結果頁中看到下圖的特性卡片,用戶填寫相關信息后,點擊“查詢”按鈕,可以打開“汽車大圣違章查詢””的智能小程序。
接入自然搜索結果
什么是小程序自然搜索?
對開發者:智能小程序為開發者提供對接百度搜索生態的能力,為智能小程序導入搜索流量,旨在打造更加開放、互聯互通的小程序生態。
對百度用戶:在百度搜索結果頁中,當智能小程序某頁面被正常檢索到,其展現形式和普通網頁相同,用戶在百度App(10.10或以上版本)點擊該條搜索結果,即可打開智能小程序。
自然搜索結果示例
搜索流量接入流程圖
開啟Web化能力
1.為什么要開啟Web化?
開啟Web化是為了讓智能小程序被搜索引擎收錄,收錄的前提是可被爬蟲發現和抓取,由于智能小程序運行在宿主 app 中,無法被爬蟲感知,所以需要對智能小程序進行 Web 化的處理(在開發工具中開啟 Web 化功能后發布小程序即可完成 Web 化小程序版本的生成),Web化可以理解為每一個智能小程序頁面都會轉碼成一張網頁。
2.如何開啟Web化?
確認賬號具有小程序開發權限(在成員管理中可進行對應權限設置)
打開“開發者工具”,點擊“項目信息”點擊“開啟 Web 化能力(原接入百度搜索)”開關
設置頁面基礎信息
1.為什么要進行頁面基礎信息設置?
智能小程序被搜索引擎正常收錄的前提是Web化,Web化后小程序將以普通網頁的形式被爬蟲發現和抓取,因此需要進行頁面基礎信息的設置用于提升搜索引擎優化。
2.頁面基礎信息都包含什么?
頁面基礎信息包括標題、摘要、Keywords等信息。這些頁面基礎信息內容,會影響到小程序在搜索結果頁中的呈現方式,需要開發者進行符合搜索要求的設置。
(1)標題:能夠更加快速洞察頁面內容,了解該結果與需求的相關性,通常是用來決定用戶點擊哪個結果的主要信息。所以,使用高質量的頁面標題對小程序來說至關重要。
(2)摘要:小程序首頁、欄目頁、分類頁的摘要非常重要,因為有可能在搜索結果中直接被用戶看到,影響到用戶是否選擇點擊查看詳情:
(3)Keywords:小程序開發者給網站某個頁面設定的詞匯,以便讓搜索引擎更好地理解頁面價值。keywords代表了小程序主題內容,無論是首頁、內頁還是欄目頁,關鍵詞一般都代表的是當前頁面或者欄目內容的主體。開發者根據實際情況設置即可。
開發者可點擊并了解頁面基礎信息配置方法
注:由于每個頁面基礎信息和頁面內容強相關,建議先通過 swan.request 請求開發者 server ,由開發者 server 返回相關信息,再通過頁面基礎信息的 API 設置到頁面中。
綁定熊掌ID
1.為什么要綁定熊掌ID?
綁定熊掌ID是為了開發者提交Sitemap使用,如果是老站替換的開發者,建議使用目標替換站點所屬的熊掌ID進行綁定,從而使小程序繼承原H5在百度搜索中的排名權重。
2.如何綁定熊掌ID?
在Web化版本小程序上線后,可在“流量配置>自然搜索結果頁面”完成熊掌ID的綁定,點擊“綁定”按鈕即可喚起綁定操作的彈窗 。
支持使用當前賬號完成注冊綁定
,也支持綁定與小程序同主體的其他熊掌ID
,綁定其他熊掌ID時需要獲取其超級管理員的手機中收到的驗證碼進行操作權限的驗證即可,開發者必須完成熊掌ID的綁定后才可進行H5站點的關聯和Sitemap的提交。
關聯H5站點
1.為何要做H5站點關聯?
H5站點關聯的內容為小程序希望替換的已有 H5站點資源,因此關聯是為了校驗開發者是否對該站點擁有操作權限,且后續可在小程序平臺中對該站點下的 top 流量資源進行替換并查看的替換結果。
2.如何配置H5域名?
可在“流量配置>自然搜索結果頁面”中關聯H5站點。一個小程序可設置關聯多個 H5站點,但關聯的站點必須屬于相同主域,且已經關聯的站點不支持解除關聯的操作,開發者可點擊“設置”按鈕進行關聯操作
若開發者當前綁定的熊掌 ID 在搜索資源平臺已經有關聯的站點,在這里即可直接選擇并進行關聯操作,無須進行站點驗證。在編輯彈窗中同時將會展示站點關聯的狀態,可關聯多個但不能解除關聯。
若開發者當前綁定的熊掌 ID 在搜索資源平臺沒有已關聯的站點,或者需要增加關聯其他站點時,可在彈窗中點擊“新建”按鈕,并在“站點權限校驗”的頁面中完成H5站點的新建綁定。新建站點時需要在 H5站點的根目錄下放置校驗文件,并驗證當前綁定熊掌 ID 超級管理員的手機號驗證碼,從而進行站點的新增和關聯操作。
3.H5站點關聯說明:
- “H5 站點”是指開發者 H5 站點的域名,一經配置之后不可更改,請謹慎填寫。
- 如果開發者存在多個 H5子域,且這些 H5子域都有對應的小程序頁面,請在這里關聯所有希望進行替換的 H5站點。
- 對于新站小程序可不用關聯 H5站點,直接提交 sitemap內容作為新資源供百度收錄即可。
配置URL映射規則
1.為什么要配置URL映射規則?
該操作主要是為了進行老站替換,同時小程序在搜索排序上也會得到相應優待,URL映射規則是為了使小程序頁面到 H5 頁面之間產生映射關系,百度搜索基于這一份映射規則來計算小程序的排序權重以及和 H5 頁面的去重處理等等,因此配置 URL映射規則對小程序入搜索至關重要。
2.URL映射規則該怎么填寫?
規則適配方式通過正則表達式的方式聲明 H5 鏈接地址與小程序路徑間的對應關系。格式舉例:
H5:
http://example.com/detail?id=1
小程序路徑:/pages/detail/index?id=1
這組對應關系可以用以下規則描述:
http://example.com/detail?id=([^&]+)
=> pages/detail/index?id=${1}
如上例所示,規則左側部分為由 H5 地址生成的正則表達式,標識了 H5 地址中與小程序參數有對應關系的部分;規則右側部分由小程序路徑和參數對組成。參數對中如果某個參數值是左側匹配到的部分,則其參數值由${左側匹配項的序號}
代替。
2.1更多示例
H5 地址 | 小程序路徑 |
---|---|
https://example.com/ | pages/home/index |
// 如果要完全匹配到 url 結尾,例如當 url 后沒有 path 時,映射小程序首頁 path,url 后要加結束符 https://example.com/$ => pages/home/index |
H5 地址 | 小程序路徑 |
---|---|
https://example.com/book?id=1&type=history
|
pages/book/index?bookid=1&type=history |
https://example.com/book?id=([^&]+)&type=([^&]+) => pages/book/index?bookid=${1}&type=${2} // 只要是符合正則規則的匹配方式都可以,例如下述規則也同樣正確 https://example.com/book?id=([\w]+)&type=(.+)$ => pages/book/index?bookid=${1}&type=${2} |
H5 地址 | 小程序路徑 |
---|---|
https://example.com/history/book?id=1
|
pages/book/index?bookid=1&type=history |
// 參數部分序號根據正則匹配的順序決定 https://example.com/([^\/]+)/book?id=([^&]+) => pages/book/index?bookid=${2}&type=${1} |
H5 地址 | 小程序路徑 |
---|---|
https://example.com/history_type/book?id=1
|
pages/book/index?bookid=1&type=history |
https://example.com/([^\_]+)_type/book?id=([^&]+) => pages/book/index?bookid=${2}&type=${1}
|
H5 地址 | 小程序路徑 |
---|---|
https://example.com/book/1.html
|
pages/book/index?bookid=1&type=history |
// 兩個地址中沒有對應項的參數保持不變 https://example.com/book/([^\.]+).html => pages/book/index?bookid=${1}&type=history |
H5 地址 | 小程序路徑 |
---|---|
https://example.com/book/history2019.html?id=1
|
pages/book?type=history |
https://example.com/book/([^\d]+)2019.html?id=1 => pages/book?type=${1}
|
3.智能小程序平臺配置 URL 映射關系
在開發者平臺>自然搜索結果中,當開發者需要對已有 H5資源配置時,可在 URL 映射規則的配置模塊完成相應內容的設置
點擊頁面中的“編輯”按鈕可選擇 直接配置 URL映射規則,或使用相應的生成工具來進行輔助配置
在 URL 映射規則的設置頁面中,開發者需要填寫具體H5 url 表達式和對應的小程序 path 表達式,并至少提供一對示例用于規則正確性的驗證,開發者可添加多組規則
當完成驗證并提交后,系統將自動為開發者對該規則覆蓋的 H5資源進行替換處理(優先對 TOP 流量的 H5資源進行替換處理),開發者需要保證對應的小程序頁面已完成“頁面基礎信息”的設置,并可在當前編輯頁面中查看替換的進度和結果。
4. URL 映射規則 – 生成工具
開發者可在URL 映射規則的配置頁面和編輯時的選擇彈窗中均可點擊相應入口引導,進入生成工具的頁面中,開發者只需要按照生成工具的引導,提供 H5 URL 示例和小程序 Path 示例,并做簡單的校驗后即可生成對應的 URL 映射規則表達式。
為了方便開發者的操作,可點擊“一鍵復制”能力并返回開發者平臺中按照提示完成已生成規則的新建和提交
提交sitemap
1.什么是Sitemap?為何要提交Sitemap?
Sitemap(即站點地圖)就是您⽹站上各⽹⻚的列表。創建并提交 Sitemap 有助于百度發現并了解您⽹站上的所有⽹⻚。您還可以使⽤ Sitemap 提供有關您⽹站的其他信息,如上次更新⽇期、Sitemap ⽂件的更新頻率等,供百度 Spider 參考。
百度對已提交的數據,不保證⼀定會抓取及索引所有⽹址。但是,我們會使⽤ Sitemap 中的數據來了解⽹站的結構等信息,這樣可以幫助我們改進抓取策略,并在⽇后能更好地對⽹站進⾏抓取。
此外,Sitemap 與搜索排名沒有關系,提交的 Sitemap 內容為⼩程序⻚⾯的 Path路徑列表
,以便百度 spider 按照其規則盡可能多的抓取和收錄⼩程序的⻚⾯。
2.Sitemap的內容
Sitemap 用于聲明主動推送給百度自然搜索收錄的頁面。列表中每一行都是一個要被收錄頁面的“路徑+參數”,格式例如 pages/list/index?id=1。
Sitemap 示例:
path/to/smartapp/list?city=bj
path/to/smartapp/list?city=sh
path/to/smartapp/detail?id=1024
pages/detail?page=2048&id=1024&deailId=4096
3. Sitemap ⽀持哪些提交格式?
百度⼩程序中 Sitemap 協議⽀持⼀種格式:txt ⽂本格式,開發者需要在⼀個 txt ⽂本中列明向百度⼩程序提交的⼩程序⻚⾯ Path 地址,并將 txt ⽂本⽂件通過開發者平臺-流量配置-⾃然搜索結果-sitemap 提交入口進⾏提交
格式示例如下:
pages/articleDetail/articleDetail?articleId=579379
pages/articleDetail/articleDetail?articleId=600884
pages/articleDetail/articleDetail?articleId=582423
pages/articleDetail/articleDetail?articleId=574993
此⽂本⽂件需要遵循以下指南:
- ⽂本⽂件每⾏都必須有⼀個 Path 路徑地址,每個路徑中不能有換⾏。
- 不應包含 Path 路徑列表以外的任何信息。
- 您必須書寫完整的⽹址⼩程序路徑,包括⻚⾯ path 內的參數
- ⽂本⽂件需使⽤ UTF-8 編碼或 GBK 編碼。
4.如何提交Sitemap?
進入智能小程序平臺,在小程序首頁,單擊“流量配置>自然搜索結果”。在自然搜索 tab 里可提交上傳 Sitemap資源。
平臺目前支持天級別收錄和周級別收錄兩種時效的提交方式:
- 天級別收錄預計2-3天完成收錄,但每日數量配額少(每個熊掌 ID 限制每日可提交3000條)
-
周級別收錄預計2-3周完成收錄,當前每日可提交5W 條,后續將放寬數量限制。
5.如何得知 Sitemap 資源的收錄索引情況
當前開發者平臺中針對 Sitemap資源的收錄索引反饋正在建設中,開發者在上傳了 Sitemap 資源后可在開發者平臺中點擊登錄“搜索資源平臺”部分的引導,使用當前綁定熊掌 ID 的超級管理員賬號查看對應小程序的收錄索引情況
搜索流量接入FAQ
Q:什么是Web化?
A:簡單來說Web化可以理解是為小程序頁面轉碼成網頁,這樣就可以被爬蟲發現和抓取,用于搜索引擎收錄使用。
Q:接入自然搜索結果前有哪些必須提前完成的?
A:1.在開發階段設置小程序的頁面基礎信息 2.小程序必須開啟web化按鈕,并且需要審核通過并且在線服務 2.小程序需要綁定熊掌ID
Q:什么是sitemap?
A:Sitemap(即站點地圖)就是您小程序上各頁面的web化url列表。創建并提交Sitemap有助于百度發現并了解您小程序上的所有頁面并完成收錄。
Q:為什么要配置URL映射規則?
A:該操作主要是為了進行老站替換,同時小程序在搜索排序上也會得到相應優待。URL映射規則是為了使小程序頁面到 H5 頁面之間產生映射關系,百度搜索基于這一份映射規則來計算小程序的排序權重以及和 H5 頁面的去重處理等等,因此配置 URL映射規則對小程序入搜索至關重要。
Q:為什么要綁定熊掌ID?
A:綁定熊掌ID是為了開發者提交Sitemap使用,如果是老站替換的開發者,建議使用原H5所屬熊掌ID進行綁定,從而使小程序繼承原H5在百度搜索中的排名權重。
Q:為何要做H5站點關聯?
A:H5域名和上文提到的URL映射規則配合使用,一起生成小程序和H5站點的映射關系,用于最終完成將原H5頁面替換為小程序頁面的操作。
Q:開發者有幾百萬甚至幾千萬的url資源量,是否要全部提交?以及目前是否有全部提交的快速通道?
A:對于小程序新資源,需要開發者盡量全的提交 Sitemap,以便被百度發現和收錄,對于已有 H5資源的替換,開發者僅需完成 H5站點的關聯和 URL 映射規則的提交即可,無需再提交大量的 Sitemap 資源,小程序平臺將優先對 H5站點下的 TOP 流量 URL進行替換處理。