發表文章

曾中仁Unicode, UTF-8, 資料型態

圖片
維基百科UTF8 劉任昌101單元 劉任昌102單元 UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一種字首碼。它可以用一至四個位元組對Unicode字元集中的所有有效編碼點進行編碼,屬於Unicode標準的一部分。(劉任昌整理自維基百科) 比較小長度的文字碼(半形英文字碼與阿拉伯數字等)使用頻率較高,直接使用Unicode編碼效率低下,浪費記憶體空間,也浪費電腦的處理資源,更浪費傳輸時間。UTF-8就是為了解決向下相容ASCII碼而設計,Unicode中前128個字元,使用與ASCII碼相同的二進位值的單個位元組進行編碼,而且字面與ASCII碼的字面一一對應,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。(劉任昌整理自維基百科)

曾中仁 JavaScript使用漢堡、三明治等字元

圖片
🍔漢堡 🍟薯條 🍕披薩 🌭熱狗 🥪三明治 🍿爆米花 繪文字EMOJI的UNICODE

曾中仁 選擇性貼上, 轉置Transpose, VLOOKUP, HLOOKUP, Column, Row

圖片
EXCEL函數: =VLOOKUP($A2,損益表,14,FALSE)  =VLOOKUP($A13,$A$2:$F$8,F$12,)  =COLUMN(E1) =ROW(A1) =TRANSPOSE(F2:F5) =HLOOKUP(B$28,橫變直,$A29,FALSE)

PowerQuer,合併資料表:損益表+資本資料表

圖片
比較直接讀取與"資料->從檔案"

公開資訊觀測站,上市公司,簽證會計師,樞紐分析

圖片
公開資訊觀測站 上市公司,簽證會計師,樞紐分析 列Rows:會計事務所,公司名稱 欄Columns:產業類別 Value:資本額的計數 上市公司,簽證會計師,樞紐分析篩選 篩選Fillters:產業類別 列Rows:會計事務所,公司名稱 欄Columns:產業類別 Value:資本額的計數

劉任昌期中考UNICODE

圖片
UNICODE常用漢字對照表 劉任昌086影片 UNICODE Table 曾中仁copy的漢字表 來源:http://www.tamasoft.co.jp/en/general-info/unicode.html 4E00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟 CJK 9E00 鸀 鸁 鸂 鸃 鸄 鸅 鸆 鸇 鸈 鸉 鸊 鸋 鸌 鸍 鸎 鸏 鸐 鸑 鸒 鸓 鸔 鸕 鸖 鸗 鸘 鸙 鸚 鸛 鸜 鸝 鸞 鸟   9E20 鸠 鸡 鸢 鸣 鸤 鸥 鸦 鸧 鸨 鸩 鸪 鸫 鸬 鸭 鸮 鸯 鸰 鸱 鸲 鸳 鸴 鸵 鸶 鸷 鸸 鸹 鸺 鸻 鸼 鸽 鸾 ...

曾中仁EXCEL資料->讀取外部資料->從WEB

圖片
劉任昌079影片 道瓊30成分股 EXCEL讀取外部資料 EXCEL讀取外部資料:曾中仁網頁 EXCEL讀取外部資料:曾中仁網頁更新後 網路爬蟲 網路爬蟲(英語:web crawler),也叫網路蜘蛛(spider),是一種用來自動瀏覽全球資訊網的網路機器人。其目的一般為編纂網路索引。 網路搜尋引擎等站點通過爬蟲軟體更新自身的網站內容或其對其他網站的索引。 網路爬蟲可以將自己所存取的頁面儲存下來,以便搜尋引擎事後生成索引供使用者搜尋。 爬蟲存取網站的過程會消耗目標系統資源。不少網路系統並不默許爬蟲工作。因此在存取大量頁面時,爬蟲需要考慮到規劃、負載,還需要講「禮貌」。 不願意被爬蟲存取、被爬蟲主人知曉的公開站點可以使用robots.txt檔案之類的方法避免存取。這個檔案可以要求機器人只對網站的一部分進行索引,或完全不作處理。  網際網路上的頁面極多,即使是最大的爬蟲系統也無法做出完整的索引。因此在公元2000年之前的全球資訊網出現初期,搜尋引擎經常找不到多少相關結果。現在的搜尋引擎在這方面已經進步很多,能夠即刻給出高品質結果。 爬蟲還可以驗證超連結和HTML代碼,用於網路抓取(參見資料驅動編程)。取自 維基百科