2012年12月31日 星期一

臺灣Open Data使用案例

        目前許多國家的政府接有將便民的資料作為Open Data,以文件資料或是資料介接的方式供民眾使用,而台灣目前僅有臺北市政府開放資料平台(http://data.taipei.gov.tw/opendata),以Excel、pdf等文件檔案格式或以JSON API介接的方式提供民眾資料,資料的內容包含公廁位置、各級醫療院所、停車場等許多方面,提供的資料包含設施名稱和作標資料,可以和地圖類的API整合運用。

   其他Open Data應用案例還有開放街道地圖(OpenStreetMap, OMP)是一種網路協作地圖,類似維基百科,提供任何人上網編輯,OpenStreetMap 台灣(http://www.openstreetmap.tw/)目前亦處在發展階段,其他還有許許多多的應用。

  台灣創用CC計畫(http://creativecommons.tw/),CC為Creative Common的縮寫,提供了6種便利使用的公眾授權條款,創作者可以從六種條款中挑選自己需要的條款將作品開放給外部使用,下圖為一CC授權的範例,表示允許使用者重製、散布、傳輸以及修改著作使用,但使用時須依照創作者指定的方式標示創作者名稱。


  這樣的授權方式使用者可以直接了解創作者是否同意別人使用他的資料,並且也對使用資料的方式進行了規範,以台灣棒球維基館為例,該網站記錄台灣棒球界的各項資料,使用的授權方式為姓名標示─相同方式分享:允許使用者重製、散布、傳輸以及修改著作(包括商業使用)。若使用者修改該著作時,僅得依本授權條款或與本授權條款類似者來散布該衍生作品。使用時必須按照著作人指定的方式表彰其姓名。






  除了臺北市政府公開資料平台,行政院也預計在2013年4月份讓 data.gov.tw 正式上線,Open Data在2013年應是會蓬勃發展的一年。

2012年12月30日 星期日

線上繪圖軟體介紹cacoo

cacoo是免費的線上繪圖軟體,有許多圖庫,
還可以自己上傳圖庫,支援多人編輯,
是個畫架構圖的好軟體。
Cacoo
https://cacoo.com/

情境感知 (Context-Awareness)


情境感知 (Context-Awareness),是智能環境(Ambient intelligence)的一環,

情境感知是一種能夠將使用者周圍所需資訊,

藉由感應器及依據當時的環境數據,

來判斷情境,並提供資訊,

依照不同的環境傳送到情境感知系統並運算或利用,

來達到無線網路環境或智能環境。

舉例來說,

將情境感知運用照護系統上,

在病患上,藉由感測器去感測病患的體溫(溫度感測器)或是是否在病床(壓力感測器)上,

感測器傳回數據給情境感知系統,

再依據數值做判斷,並通知家人、護理人員及醫院,

給予病患適當的補助。

參考文獻:

以病患為中心的情境感知照護系統

ASP、JSP、PHP 分析


如題根據現今最常用的三個動態網頁進行整理及分析。

  • ASP(Active Server Pages)

優點:
1.簡單易學,所以有人在說這個開發基礎是最廣的。而且MS有一向做的非常好的聯機手冊。
2.安裝使用方便,只要安裝了IIS哪麼ASP就可以使用了。
3.開發工具強大而多樣,易用、簡單、人性化,這就是微軟的強項。 
4.效率高。網站流量較低情況下,ASP能表現出一定的效率。 
5.可使用抓取或自製的ActiveX 元件擴充程式功能。
6.可存取多種類型資料庫(SQL、mdb、xls、text...)。
缺點:
1.只能使用Microsoft的NT/XP Server的IIS當Web Server,Unix上執行需另外安裝mod_perl和mod_asp套件。
2.Win XP/7等WorkStation(Professional)版的作業系統上,安裝PWS(Personal web Server)/IIS有10個連線的限制。
3.Windows作業系統的漏洞百出,需要管理者經常修補(patch),以避免駭客或Cracker利用系統漏洞入侵IIS竊取或毀損重要資料。
4.Windows Server主機軟體昂貴,需要另外購買SQL存取使用權。
5.Windows SQL資料庫效率高但軟體版權昂貴。
6.大量使用者上線時,用MDB當後端資料庫站台效能不是很好。
  • JSP(Java Server Pages)
優點:
1.在一處平台編寫其它平台皆可運行。
2.網頁伺服器 java servlet/jsp的Web Server/Application Server 等多台平的支援。
3.jar文件就可以運行servlet/jsp到由多台服務器進行群集和覆載,到多台Application進行事務處理。像是強大的的可伸縮性。
4.java已經有了許多非常優秀的開發工具而且有許多可以免費得到,有多樣化和功能強大的開發工具。

缺點:
1.由於為了跨平台的功能,為了這樣的伸縮能力,所以增加了產品的複雜性
2.在國內缺少java的資源,在書店裡看到一本JSP 系統性的書籍少之又少
3.伺服器將你的Jsp文件轉換成.java文件,這個.java文件是繼承httpServlet類別,也就是.jsp轉換成servlet代碼,所以是轉換導致速度慢。
  • PHP(Personal Home Page )
優點:
1.能快速學習、跨平台和資料庫有良好交互能力的開發語言。
2.語法簡單,易學使用。
3.與Apache及其它擴展緊密結合
4.較良好的安全性。
5.通常搭配MySQL資料庫,可免費使用、存取效率快且功能強大的資料庫軟體。
缺點:
1.PHP提供的資料庫連接,與其它資料庫彼此不能統一。
2.不適合應用於大型電子商務站點。
3.安裝複雜。
4.缺少正規的商業支持。
5.無法實現商品化應用的開發。

分析比較

事項ASPJSPPHP
網頁伺服器IISTomcatApache
編譯語言C#、VBJAVA PHP
搭配資料庫MSSQLMySQLMySQL
適用範圍小型電子商務大型電子商務小型電子商務
國內廣泛使用程度廣泛較不廣泛廣泛
迴圈測試較快最快
Oracle資料庫測試最快較快

兵棋聯模物件模型Federation Object Model(FOM)




FOM(Federation Object Model)是一種HLA dependent的資訊交換模型,依據HLA的規範必須再針對包括HLA Dimensions HLA TimeHLA TagsHLA Synchronizations HLA Transportations HLA Switches等資料傳輸或演訓控制管理等內容進行描述,這些部分並不會包含在BOM中,因為這些內容可能會因不同的演訓需求而有所不同。

以下為OMT定義 FOM的項目:
一、 
1.    HLA ObjectClass:用於紀錄FOMSOM的所有物件類別名稱並描述他們的類別與子類別關係。
2.    HLA InteractionClass:用於紀錄FOMSOM的所有相互作用的類別名稱並描述他們的類別與子類別關係。
3.    HLA Attribute:詳細說明FOMSOM中物件屬性的特性。
4.    Parameter:用於詳細說明FOMSOM中相互作用的參數特性。
二、 
1.    HLA Time:用於說明時間值得表示。
2.    HLA tag:用於說明應用於HLA服務中的標籤表示方法。
3.    HLA Synchronization:用於說明HLA服務中的表示和數據類型。
4.    HLA Transportation:用於描述所用的傳輸機制。
5.    HLA Switches:用於描述RTI所用的參數初始設置。
6.    HLA Datatype用於說明object model中數據表示的細節,實際是由6個項目組成:
I.    basicDataRepresentations
II.  simpleDataTypes
III.enumeratedDataTypes
IV.  arrayDataTypes
V.    fixedRecordDataTypes
VI.  variantRecordDataTypes

參考論文資料: 遵循IEEE1516標準的對像模型開發工具研究與實現

2012年12月27日 星期四

Web services


Web services












以上面這張圖來說 可以分為:
Service Provider 服務提供者
Service Broker/registry 服務公告
Service Requestor 服務需求

Service Broker就像提供者與需求者的中介,主要分為註冊、尋找、連接
服務提供者將Web Services 使用UDDI註冊並且公告,而需求者可以去尋找自己所需要的Web Services,並且使用SOAP進行連接Web services

SOAP(Simple Object Access Protocol):以XML為基礎並架構在HTTP之上,以文字為基礎的通訊協定,傳送的標準。
WSDL(Web Services Description Language):以XML方式描述service的定義、溝通方式等內容。
UDDI(Universal Description, Discovery, and Integration):是一個基於XML的跨平台的描述規範,可以在網路上發布自己所提供的服務,內含service的內容、WSDL的URL、連結資訊。
----------------------------------------------
心得:

主要會閱讀這些資料,是因為在看Paper的時候,對於Web services的整個流程還不夠了解

所以在網路上重新了解整個Web services的流程與架構

圖片來源:Personalized Service Provision in a Context-aware Shopping Environment

2012年11月30日 星期五

Shell Scripts

Shell Scripts可以說是Linux管理者必學的!
可以將複雜的工作是先寫成一個巨集,
方便以後使用,不只是這樣,還可以
搭配多種程式語言開發出更多服務,
Shell Scripts是用一般文字檔撰寫,但是
在Ubuntu裡要先給足夠的權限,設定成
可執行檔才能執行,以下網址有介紹
Shell Scripts的使用方法
http://www.twbsd.org/cht/book/ch24.htm

HL7 v2.6- 訊息控制區段與批次發送訊息協定 (HL7 batch protocol)


HL7中分4個區段來解決批次處理問題

檔案
FHS
FTS
批次
BHS
BTS
基本原則:
1.    一個傳送字串只有一個檔案。
2.    一個檔案可以包含數個批次。
3.    一個批次可以包含數個訊息。
檔案與批次,頭的部份算是MSH的精簡版,內容也要一模一樣。
而尾的部分,就是增加包覆的多少個。
1.    FTS.1註記包覆了多少個批次。
2.    BTS.1註記包覆了多少個訊息。
批次訊息結構   :
批次訊息字串的結構:
[FHS]
{
   [BHS]
   { [
      MSH
     ...
     ...
   ] }
   [BTS]
}
[FTS]
HL7批次傳送使用序列號協定,避免各訊息間的混淆另外仍須符合訊息建構規則


參考學習網站:
電子病歷實作技術支援網站

2012年11月29日 星期四

Cascading Style Sheets 簡寫CSS

一種用來為結構化文件(如HTML文件或XML應用)添加樣式(字型、間距和顏色等)的電腦語言

一個網頁的讀者和作者都可以使用CSS來決定檔案的顏色、字型、排版等顯示特性。
CSS最主要的目的是將檔案的結構與檔案的顯示分隔開來。
這個分隔有許多好處:
  1. 檔案的可讀性被加強
  2. 檔案的結構更加靈活
  3. 作者和讀者可以自己決定檔案的顯示
  4. 檔案的結構簡化了。

CSS可以與XHTML、XML結構檔案一起使用,
也可以是其他的語言結構,
但是顯示的語言結構必須具備了接受CSS的功能。

HTML檔案中的每一個classID都可以有自己的顯示特徵,
如果沒有ID特性的HTML結構也能顯示自己的特徵。

CSS訊息可以來自:
  • 作者樣式
    • 作者可以在他的HTML檔案中確定一個外來的、獨立的CSS檔案
    • 作者可以將CSS訊息包含在HTML檔案內
    • 作者可以在一個HTML指令內結合CSS指令,這樣做一般是為了在一個特殊情況下將總體的CSS指令抵消掉
  • 讀者樣式
    • 讀者可以在他的瀏覽器內設立一個地區性的CSS檔案。這個CSS檔案可以用在所有的HTML檔案上。假如作者的CSS檔案與讀者的相衝突,那麼讀者可以確定他想使用哪個
  • 瀏覽器的樣式
    • 假如外部沒有特別指定一個樣式的話,一般瀏覽器自己有一個內在的樣式

使用CSS的優點有:
  • 一個整個網站或其中一部分網頁的顯示訊息被集中在一個地方,要改變它們很方便
  • 不同的讀者可以有不同的樣式,比如有的讀者需要字型比較大
  • HTML檔案本身的範圍變小了,它的結構簡單了,它不需要包含顯示的訊息

Jena應用

Jena由HP Labs 開發的Java api,主要是語意網(Semantic Web)中應用程式的開發,以及用於RDF和OWL所組成的ontology,進行創建、修改、查詢和推論的操作

Jena框架包含:

  • API的讀取,在XML處理和寫入RDF,N-三元組(triples)和 Turtle格式。
  • 處理OWL和RDFS ontologies 的ontology API。
  • 推理是根據RDF和OWL資料來源規則進行推論的引擎。
  • 允許大量的RDF三元組(triples)在磁碟有效的儲存做備份。
  • 符合最新的SPARQL規格的查詢引擎。
  • 允許RDF資料被發佈給其他應用程式使用各種協定服務,包括SPARQL。

SPARQL介紹:

  • SPARQL(讀做「sparkle」、「史巴–摳」)是一種用於RDF上的查詢語言,代表SPARQL Protocol and RDF Query Language(SPARQL協定與RDF查詢語言)」。
  • 它的標準化為全球資訊網協會RDF資料存取工作小組(DAWG)所進行,被認為是語意網的一個關鍵。
  • 2008年1月15日,SPARQL正式成為一項W3C推薦標準
  • 一個SPARQL查詢由一些三體組合、與邏輯或邏輯,及選項組合所組成。
如下圖表示兩者之間的關係
  1. 啟用Jena推論
  2. OWL找尋提供的RDF
  3. RDF根據OWL所制定的規則
  4. 兩者結合產生Ontology
  5. SPARQL可以查詢去執行

Linked Data & Open Data

Open Data

Open Data指的是在網路上公開,不受專利、著作權約束並且具有公信力的資料,且任何人都能使用這些資料,不會受到任何限制。

許多歐美國家政府皆有data.gov網站,用以將政府的資料發佈到網上供民眾使用即Linked Government Data。台灣目前只有台北市政府提供了Open data平台:台北市政府公開資料平台
提供台北市內的一些便民資料,提供的資料不限格式,可能是pdf、doc、excel或是其他格式的檔案。


Linked Data

Linked Data指的是在語意網技術的RDF檔案中加入URI,在表示任一物件時皆使用URI作為物件的名稱,則使用者可以透過URI找到該物件。
Linked Data指的是在語意網中已被發佈、串連結構化的資料。若使用者已經有了一些Linked Data,便可以透過它找到其他相關的資料。W3C對Linked Data的定義是網路上相互關聯的資料集的集合。
Linked Data的四項原則:

1. 把URI當作東西的名字使用。

2. 為了讓人們可以查找這些名字,使用HTTP URI。

3. 當在搜尋某個URI的時候,以規範的標準(RDF、SPARQL)來提供有用的資料。

4. 在提供的資料裡,給予指到別的URI的連結,使搜尋者可以發現更多東西。

Linked Data就是在任意事物間的資料是透過RDF建立連結。並透過 URI  標示物件或概念。



Linked Data & Open Data

Linked Open Data就是將Linked Data技術和Open Data的概念作結合,將Open Data的資料加入Linked Data的RDF triple和URI,讓Open Data的資料也可以互相串連。現在一般說的Linked Data皆是指Linked Open Data。以DBpedia為整個Linked Open Data的樞紐串聯起整個Linked Data Cloud。

英國政府亦提供RDF-triple格式的Linked Open Data,因為是以RDF格式提供,可以使用存取XML的方式使用政府提供的資料。


2012年11月23日 星期五

UML-組成和聚集的差異

UML:

空心的菱形:聚合

子類別是可以不依靠父類別而存在的

ex:學生與老師

實心的菱形:組成

子類別是必須依靠父類別而存在的

ex:輪胎與車,公司與部門

組成和聚集的差異主要是子類別的生命周期不同。組合關係中,父類別被銷毀子類別也會隨著銷毀然而在聚合關係中,子類別的生命周期與父類別獨立不影響。

2012年10月31日 星期三

Health level 7 JAVA開發環境(免費)


HL7推動困難的點在於
1.HL7不具有強制性:目前雖有CDC等單位有大力支持,但承攬廠商卻無法列HL7為唯一標準。也造成了醫療院所觀望。
2.效益不彰:HL7是支援應用程式整合之用,但使用者能感受的是應用系統,無關HL7
3.實作技術的門檻:HL7在實作上印象中需要投入人力,要投資高額費用採購相關軟體。

這邊有找到免費開發環境資料,資料中以下面幾個項目組合成一個免費開發環境
1.   JAVA JDK
2.   Eclipse IDE
3.   HAPI

最主要是HAPI首先進入HAPI的網站接下來會看到如下圖:


HAPI網站圖
接下來點擊紅色框框選項,下載最新版本HAPI,下載好解壓縮之後必須要設先設定環境變數

環境變數
要先設定一個名稱為HAPI_HOME,路徑指向HAPI資料夾,完成後必須開啟dos輸入指令來測試
指令
分別輸入如上圖指令後,如果成功即會跑出









Linked Open Data cloud diagram

Linked Open Data cloud diagram 是將網路上現存相連的Linked Data資料集以網路雲圖加以表示的產物,從最早2007年時在資料雲圖中只有12個相連的資料集,到2011年時已經有各種領域共 295個資料集互相連結,成長速度十分快速。


2007年時的資料雲圖

2011年時的資料雲圖 連結

在最新版的資料雲圖中以顏色將不同領域的資料集做區分,共分為:多媒體、地理、出版品、用戶生成內容 、政府、跨領域、生命科學這七大分類。

部分資料集介紹:

多媒體:   

    MusicBrainz:MusicBrainz是線上的音樂百科全書,像是音樂界的維基百科,提供任何使用者編輯關於音樂的資料。


    NewYorkTimes:將紐約時報中的訊息作為RDF發佈,使其在網路上可以被存取。

地理:
    GeoName:為地理領域中最多被連結的資料集,透過從其他資料集和網路資源中取得的資訊,加上Google Map API的功能,可以幫助使用者很快速的了解目標地點和周圍地理特徵。

    LinkedGeoData:LinkedGeoData使用OpenStreetMap計劃所收集到的資訊,並作為一個RDF知識資源公布在網路上,供其他做串連。

出版品:
    DPLB:DPLB是一個關於科學論文的書目資料集,可以從作者或各種書本資訊查詢書籍資料,亦提供一個RKB Explorer讓使用者可以用SPARQL查詢資料。

    CiteSeer:也是一個關於學術論文的知識庫,並且主要集中在電腦和資訊科學領域。料集

用戶生成內容:
    Flickr Wreppr:將DBpedia從維基百科中提取出的RDF連結延伸Tag到Flickr發佈的相片上。

政府:
    Ordnance Survey:為英國政府全國地形測量局所發佈的資料集,涵蓋的範圍包含英格蘭、蘇格蘭和威爾斯。

跨領域:
    DBpedia:目前最大的資料集,以維基百科的資料加以結構化,幾乎和所有的Linked Data互相串連,目前Linked Data資料雲的中心樞紐。

    Freebase:為一個巨大的線上協作知識庫,提供程式工程師以API、RDF終端方式存取知識庫內的資料,freebase是在2008年國際語意網研討會上發佈將知識庫中的topic生成RDF的服務,使freebase的資料可以做為Linked Data被串連和存取。

生命科學:
    Uniport:一個提供蛋白質序列和功能訊息的資料集,包含了大量的蛋白質功能研究文獻,也提供以RDF方式供網路上其他資源使用。

2012年10月30日 星期二

SOAP


SOAP,全寫為Simple Object Access Protocol,

是交換資料的一種協議規範,使用web 服務,SOAP為了簡化 Web Server ,
他藉由XML提取資料,節省去格式化頁面時間,不同以往的應用程式那樣,
按照HTTP通信協議,遵從XML格式執行資料互換,使其抽象於語言實現、平台和硬體。

傳輸方式

SOAP使用網際網路應用層協議作為其傳輸協議。
SMTP以及HTTP協議都可以用來傳輸SOAP訊息,但是由於HTTP在如今的網際網路結構中工作得很好,特別是在網路防火牆下仍然正常工作,所以被廣泛採納。SOAP亦可以在HTTPS上傳輸。
SOAP的訊息格式採用XML。

語法規則

SOAP 訊息必須用 XML 來編碼
SOAP 訊息必須使用 SOAP Envelope 命名空間
SOAP 訊息必須使用 SOAP Encoding 命名空間
SOAP 訊息不能包含 DTD 引用
SOAP 訊息不能包含 XML 處理指令

Google雲端服務介紹

Google希望能提供使用者良好的網路工具和無限制的空間,
使用者只需要透過網路就能滿足需求,Google目前提供的
雲端服務有Google office 、Google Apps和Google Drive,
其中Google office提供多種文件格式的編輯,
使用者透過網路就能編輯文件,Google Drive提供雲端硬碟,
可以透過網路存取自己的檔案,Google Apps
提供使用者利用Google API撰寫應用程式提供服務,
以下有每個服務的網址
Google office
http://www.google.com/google-d-s/intl/zh-TW/tour1.html
Google Drive
http://www.google.com/intl/zh-TW/drive/start/index.html
Google Apps
http://www.googleapps.com.tw/

2012年10月29日 星期一

DOM & SAX2 兩種XML剖析


DOM(Document Object Model)
是完整讀入XML檔案儲存在記憶體,將一份結構化文件轉換成一棵節點(Nodes)組成的樹狀結構如:XML、HTML。文件提供節點的相關屬性和方法存取元素內容也可新增、刪除、修改節點內容。

如下表示剖析示意圖


SAX 2(Simple API for XML version 2)
SAX是組程式介面,可將XML文件視為文字串流的資料,在讀取XML元素時觸發一系列事件,只需撰寫所需的事件處理程序就可取得XML元素。

如下表示剖析示意圖


     剖析方式
項目              
DOMSAX 2
讀取速度較慢較快
系統資源佔用較多系統資源佔用較少系統資源
記憶體使用大量記憶體空間小的記憶體空間
XML編輯內容可編輯內容只能唯讀


建議
假如只是純粹讀取XML檔案,使用上可選擇SAX 2可節省許多資源。
倘若是用於XML的編輯上也只能使用DOM的方式去剖析。


2012年10月17日 星期三

Model Driven Architecture,MDA


模型驅動架構(Model Driven Architecture, MDA)


物件管理組織(object management group, OMG)在2001年提出了模型驅動架構MDA,主要目的是解決以往塑模系統時,轉換到不同平台的時候無法再繼續使用。MDA的架構中有兩個階段,描述系統抽象邏輯設計的Platform Independent Model (PIM)與把PIM 結合實作平台的資訊來產生的Platform Specific Model (PSM)


MDA的好處:

1.減短系統開發的週期:系統的程式碼可以從Model產生出來,所以可以降低系統開發所需的時間

2.降低系統開發的成本:由於部份程式的實作可以透過工具產出,所以可以減少人力上的需求。

3.增加系統的品質:由於程式碼可以是從PSM模型自動或是半自動的產出程式碼,所以可以降低BUG的機率與降低複雜度。

4.降低不同平台轉換之間的困難度:由於MDA可以從系統的PIM 直接投射到某個實作平台上的PSM 後再產出程式碼,所以可以降低不同平台之間轉換的困難度。

5.增加Model的使用性:由於系統的PIM 描述的是系統的抽象邏輯,所以將來若有其他專案系統的設計跟原來的系統類似,就可以直接使用或是修改原有系統的PIM,所以透過MDA 將模型重複利用。

------------
參考資料:網路

2012年9月30日 星期日

HTML5介紹(2)


補充一些HTML5的介紹

HTML5於2004年提出,並在2007被W3C所採納,目前仍處於發展階段,其目標是取代使用已久的HTML4.01及XHTML1.0標準,現今大多瀏覽器也都開發出支援HTML5技術之版本
一般廣義而言,HTML5是包含了HTML、CSS及JavaScript三個部分,他與HTML4不同之處大略有以下幾點:
  • 統一檔案類型聲明: <!DOCTYPE HTML>
  • 不再基於SGML的新解析順序
  • 新的元素:  section, video, progress, nav, meter, time, aside, canvas, command, datalist, details, embed, figcaption, figure, footer, header, hgroup, keygen, mark, output, rp, rt, ruby, source, summary, wbr
  • 元素input的新類型:date, email, url 等等
  • 新的屬性: ping(用於aarea), charset(用於meta), async(用於script
  • 全域元素: id, tabindex, repeat
  • 新的全域屬性:contenteditable, contextmenu, draggable, dropzone, hidden, spellcheck
  • 移除元素: acronym, applet, basefont, big, center, dir, font, frame, frameset, isindex, noframes, strike, tt

HTML4
HTML5
 由上圖可看出HTML5引入了新的元素,使用div元素標記這些區塊並定義描述性的id或class,而這些是HTML4所欠缺的語義化的結構,瀏覽器能更快速的知道網頁各個部分所代表的意義,這種更簡潔的代碼及語義標籤也能讓搜尋引擎更準確分析這些內容的重要性和關聯性,其最大的助益在於搜尋引擎的優化(SEO)以及語意推薦系統上能有很大的幫助

HTML5焦點在於用戶端的資料儲存,讓user能以互動方式來編輯文件;並同時提供簡潔的規則,題是如何正確的處理HTML文件;並以HTML語法或XML語法編寫而成,把網路應用程式互通性帶到行動平台上

DryadLINQ 簡介

DryadLINQ

是一個結合了微軟技術平台上的 Dryad 分散式執行引擎 及 LINQ 整合性查詢語法

 Dryad 的功能有點類似 Hadoop 的 MapReduce 可以將運算分割

能夠將LINQ編寫的程序轉變為能夠在Dryad上運行的程序,進行大規模的分布式計算,

再將資料合併,Dryad 也提供了運算資源的管理、Job 的視覺化監控、容錯機制、排程功能、計算及重新執行 Job 的機制等。

DryadLINQ可以把LINQ程序轉化成分布式計算指令,以便運行於PC集群的編譯器。




DryadLINQ的LINQ程序可以分解為三個步驟:

  1. C#和LINQ數據對象轉化為分布式的文件塊。

  2. LINQ查詢轉化為分布式Dryad任務。

  3. C#方法轉化為運行於Dryad任務節點上的代碼。


1. 聲明式編程:計算指令要求使用類似SQL的高級語言進行表示。

2. 自動並行化:DryadLINQ編譯器將順序的聲明式代碼,轉化為分布在大規模計算機集群中高
度並行的查詢計劃。而對於單臺機器中多核的使用,DryadLINQ則依賴PLINQ並行框架。

3. Visual Studio集成:程序員在使用DryadLINQ時可以利用VS中大量的高級特性,如智能提示、代碼重構、集成調試、構建以及原代碼管理。

4. .NET集成:所有的.NET類庫,包括Visual Basic,以及各種動態語言都可以自由使用。

5. 類型安全:對分布式計算進行靜態檢查。

6. 自動序列化:數據傳輸機制會自動處理所有的.NET對象類型。
7. 任務圖的優化靜態:一系列豐富的查詢優化規則,可以使查詢計劃有更好的局部性(locality)及更好的性能。

8. 動態:對已經處理完的數據集進行統計,以此作為運行時的優化查詢計劃的依據。


參考網址:
http://research.microsoft.com/en-us/projects/dryadlinq/default.aspx

2012年9月29日 星期六

D2RQ簡介

D2RQ提供了非RDF架構的關聯式資料庫以一個唯獨的的虛擬RDF架構瀏覽模式,並可以用存取RDF檔案的方法存取關聯式資料庫。D2RQ支援Oracle、MySQL、PostgreSQL、Microsoft SQL Server關聯式資料庫。

在D2RQ中主要使用Mapping File來完成關聯式資料庫中關聯對RDF架構的映射,D2R Server即透過Mapping File產生一虛擬的RDF View,可用的功能包括使用RDF Browser瀏覽資料庫內容,以及使用SPARQL查找資料,亦可以透過Mapping File將資料庫的內容轉換為一份真的RDF檔案。

D2RQ支援Jena API,可在Java程式碼中透過Mapping File使用SPARQL存取資料庫內容。

透過修改Mapping檔案,可以讓使用D2RQ產生的RDF檔案連結外部的Data sets使該資料庫的資料成為Linked Data。

使用D2RQ可以使用關聯式資料庫快速建立Linked Data的RDF架構檔案,且可以透過瀏覽器查找資料庫中的資料,在使用上非常的方便,在Jena API的部分,可以使用Java程式碼中SPARQL對資料庫中的資料進行檢索,但是使用JDBC執行SQL query可以達到一樣的效果,使用SPARQL和JDBC相較之下有什麼樣的差別是一個可以研究的地方。

資料來源:http://d2rq.org/

2012年9月28日 星期五

雲端產業介紹

雲端產業又分為三種服務 Software as a Service (SaaS) 、平台服務Platform as a Service (PaaS) 、基礎設施服務 Infrastructure as a Service (IaaS)。
SaaS是一種服務的觀念,以租借的方式提供客戶服務。
PaaS是一個提供資訊人員開發的平台,讓使用者將自己所撰寫的服務上傳到平台上並提供服務。
IaaS屬於雲端運算的基礎設施。

2012年9月26日 星期三

Health level 7


     HL7是基於xml標準的技術並對應到OSI的第七層(應用層),第七層主要是安全查驗( Security Checks ) 、參與者身份識別( Participant Identification)、可行性檢測(Availability Checks)、訊息轉換機制協定(Exchange Mechanism Negotiations)及訊息轉換結構(Data Exchange Structuring)。
     HL7發展主要經由對醫療保健應用系統間資料交換標準之定義,並減少維護負擔簡化系統之間整合的複雜度,那HL7 的訊息架構建立於資料與資料之間,可以分成三個部份:

第一部份:
HL7 Message Creation,主要是將來源資料轉換成HL7 的訊息架構,HL7標準協會將整個HL7 訊息架構的建立過程稱為Message Develop Framework(MDF),將MDF 轉至真實的訊息實體的過程稱為Implementation Technology Specification (ITS)

第二部份:
Message Instance,指的是訊息交換過程,通常表示著訊息在實體網路環境上的交換過程,既然資料已經轉換成為HL7 標準,那麼資料與資料之間就可以做溝通交換。

第三部份:
HL7 Message Parsing,作用是將HL7 訊息轉換成為資料目的地的格式。

    HL7雖然定義了醫療資訊的交換標準,簡化了資料交換中介程式之負擔,但因為其格式複雜閱讀起來很耗時,資料欄位大部分為可選擇性,因此在判讀其完整性及合法性時需要額外提出剖析文件的機制。因此在HL7 3.0W3C提出以XML 編譯設計,醫療系統之間的訊息則透過XML做電子資料交換,HL7欄位則以XML標籤來定義,驗證的文件方法則以XMLDTD以及Schema提供。
下圖為HL7格式XML格式




參考資料:

2012年9月21日 星期五

QR code 也能做改變


QR碼是二維條碼的其中一種,1994年由日本DENSO WAVE公司發明。QR來自英文「Quick Response」的縮寫。QR code最常見於日本並且為日本目前最流行的二維空間條碼。QR碼比普通條碼可儲存更多資料,也能輕鬆被解碼。

QR碼呈正方形,只有黑白兩色。在3個角落,印有較小像「回」字的的正方圖案。這3個是幫助解碼軟體定位的圖案,使用者不需要對準無論以任何角度掃描,資料仍可正確被讀取。

目前在網路上與手機app軟體皆有解讀QR code的程式,QR code也慢慢開始產生了變化,主要是利用QRcode的高容錯率來做變化

錯誤修正容量
L水平 7%的字碼可被修正
M水平 15%的字碼可被修正
Q水平 25%的字碼可被修正
H水平 30%的字碼可被修正



所以現在常常看到QR code上有別的廠牌的標誌
也是利用高容錯率的優點來完成的

參考資料與延伸閱讀:



2012年9月20日 星期四

XsltEditor


  XsltEditor是一個XSLT語法的驗證工具,可先讓使用者先透過此工具驗證XSLT語法是否正確,可利於XSLT的除錯,讓XML下執行可確保XSLT的無誤。
以下網址為一個Web上的XSLT驗證
畫面如下圖1
圖1.
說明 如下圖2
圖2.
完成  如下圖3
圖3.
優點:1.直接在Web上撰寫XML。
            2.XSLT在Web上驗證,將偵錯錯誤結果顯示。
缺點:1.無法直接將XML和XSLT應用顯示出。
若不使用Web上驗證,也可搜尋XsltEditor有許多開放下載的驗證程式。