2020年4月9日、中国共産党中央・国務院は「より完全な要素の市場化配置体制の構築に関する意見」を発表し、初めてデータと土地、労働力、資本、技術などの伝統的な要素を要素の一つに並べ、政府のデータ開放共有の推進、社会データの資源価値の向上、データ資本の強化など、データ要素の市場の育成を加速させることを提案した。源の整合と安全保護などの三つの方面の仕事
データは要素として新たな命題であり、大量の先端問題を研究する必要がある。
文献では、関連問題はデータ経済の範疇に属する。
データ経済とは、データ収集、組織、使用、共有、流通、管理などの活動からなる経済生態をいう。
デロイトとアリ研究院(2019)は、データ資産は会計基準の中の「資産」及び「無形資産」の定義に完全に一致していないと考えています。
ケンブリッジ大学の研究報告書「データの価値」(BIPP、2020)は、データ経済の理論、実践と政策問題を全面的に総括した。
李小加(2020)はデータ要素産業化連盟を設立し、データ経済の8つの面で重要な問題を整理することを提案している。
施洋など(2020)において、中国のデータ要素の市場化配置の深化に対する挑戦を分析し、公共プラットフォームの構築、市場条件の改善、サポート政策の研究、連携推進、市場構造の最適化などの政策提言を提出した。
しかし、国内外の研究から見ると、データ経済は盛んで未踏の分野であり、学術研究は業界と監督管理の実践にやや遅れており、多くの新しい概念、新しい問題と新しいメカニズムが整備されている。
本文は以下の三つの問題について初歩的に検討しました。第一に、データ要素はどのような重要な技術と経済学の特徴がありますか?第二に、データ価値の内包と計量方法、第三に、データ要素の配置メカニズム
一、データ要素の技術と経済学の特徴(一)データの技術的特徴は何ですか?一般的に考えられているのと違って、これは情報科学の中の一つの基本であるが、複雑な問題であり、明らかな答えはない。
データの理解は情報や知識などの関連概念の分析から切り離せない。
Ackoff(1989)はDIKWモデル(図1)、Dはデータ、Iは情報、Kは知識、Wは知恵(Wisdom)を示している。
DIKWモデルは情報管理、情報システムと知識管理などの分野で広く使われています。異なる研究者は異なる角度から異なる解釈を与えています。Rowley(2007)は総括的に述べました。
この論文ではDIKWモデルについて深く議論しないで、Rowley(2007)の基礎の上でデータを整理する技術的特徴の中で経済学の分析に最も関連している部分だけを分析します。
図1:DIKWモデル第一に、知恵、知識、情報とデータの間に、狭い口径から広い口径までの従属関係が順次存在する。
データから情報を抽出し、情報から知識をまとめ、知識から知恵を昇華させることができます。
これらの抽出、総括、昇華はすべて簡単な機械的過程ではありませんて、異なった方法論と余分な入力に頼って(たとえば応用シーンと関連学科の背景知識)
そのため、情報、知識、知恵はデータの範疇にも属しますが、「高次」のデータです。
第二に、データは観察の産物である。
観察対象は物体、個人、機構、事件及びそれらが置かれている環境などです。
観察は、一連の画角、方法、ツールに基づいて行われ、計量単位などの記号表現システムが付随している。
データとは、これらの記号表現システムで観察対象の特徴と行為を記録したものです。
データは文字、数字、図表、音声、ビデオなどの形式をとることができます。
存在形態では、データはデジタル化されています。デジタル化されていないものもあります。
しかし、情報と通信技術(ICT)の発展につれて、ますます多くのデータがデジタル化され、底層ではバイナリとして表されています。
第三に、データは認知プロセスを経て情報を得て、誰(Who)、何(What)、どこ(Whee)、いつ(Whe)などの問題に関する答えを与えます。
情報は組織と構造化されたデータであり、特定の目標と情景と関係があるため、価値と意義がある。
例えば情報論によれば、情報はエントロピー計量による不確定性を削減することができる。
第四に、データと情報と比べて、知識と知恵は正確に定義されにくいです。
知識はデータと情報の応用で、どうやって作るかについての答えを出します。
知恵は鮮明な価値判断の意味があり、多くの場合、未来の予測と価値観に関係があります。
次に計量経済学を例にとってDIKWモデルを説明します。
計量経済学は経済学の実証分析の主要な方法である。
実証分析は観察に基づいて、「何ですか?」
計量経済学では、観察の対象を一般的にサンプルと呼び、個人、機構、地域、さらには国家でもいいです。
さまざまな角度からサンプルを観察し、計量経済学における変数概念に対応する。
異なる角度からサンプルのセットを見て断面データを得たが、異なる時点で同じ角度から連続して観察された時系列データ、断面データと時系列データの総合はパネルデータである。
これらのタイプのデータはすべて構造データです。
ますます多くのデータがデジタル化されるにつれて、人工知能と大データ分析方法の発展、半構造化データと非構造化データは経済学においてもますます多くの応用があります。
計量経済学はデータから情報を抽出し、主に以下を含む。一つはデータに含まれている法則とパターンを発見すること。二つは推定モデルである。三つは検査仮説である。
これはDIKWモデルの情報レベルに対応しています。
例えば、データに対して記述統計を行い、変数の平均値、標準偏差、変数間の相関係数などを計算することは、データから情報を抽出する最も簡単な方法の一つである。
計量経済学では、データはデータ生成プロセス(Data Geeatio Pocess)に従うと仮定することが多いが、データ生成過程のモデル形式とパラメータの取得値は不明であり、ランダム干渉は観察に誤差をもたらす。
計量経済学は観測したデータに基づいて、データ生成過程を推定し、またこれに基づいて仮説を検証する。
人工知能と大きなデータ分析方法はデータの処理にもっと柔軟で、予測型分析と記述型分析に分けられます。
予測型分析は、ある変数の値をもとに、他の変数の値を予測します。
記述型分析は、関連、傾向、クラスター、軌跡、異常などのデータにおける潜在的な連絡を導き出すパターンである。
二つの分析は分類、回帰、関連分析、クラスター分析、推薦システムと異常検出などの具体的な方法として現れています。
計量経済学の分析結果に基づいて政策提案を提出し、DIKWモデルの知識レベルに対応しています。
多くの政策研究は規範分析に属し、「何をすべきか」という問題に答えています。
経済学は経済バランス、経済成長、マクロコントロール、価格メカニズム、ミクロ激励とリスク定価などの面での見識について、DIKWモデルの知恵レベルに対応しています。
サンプル数、変数数、時間系列長、占用記憶空間などのデータ容量
データの品質、例えばサンプルに代表性があるかどうか、データは事前に定義された仕様と基準に合致しているかどうか、観察された粒子度、精度と誤差、およびデータの完全性(例えばデータの欠損状況があるかどうか)。
データの時効性
観察対象の特徴や行動は時間とともに変化しますが、データはまだ観察対象の状況を反映していますか?データソース
一部のデータは最初の手の観察から来ています。一部のデータは最初の手の観察者によって提供されます。他のデータから導出されたデータもあります。
データは制御された実験とサンプリング調査から来ることができます。インターネット、SNS、モノのインターネット、工業インターネットなどからも利用できます。
データは人によってもいいし、機械によってもいいです。
データはオンラインからでもいいし、オフラインからでもいいです。
データの種類は、デジタル化か非デジタル化か、構造化か非構造か、存在形態(文字、数字、図表、音声とビデオなど)を含みます。
サンプルIDが統一されているかどうか、変数定義が一致しているかどうか、データ単位が一致しているかどうかなど、異なるデータセット間の相互操作性と接続性があります。
個人データかどうか
個人データはプライバシー保護の上で多くの特殊性があります。
(二)データの経済学の特徴はデータの技術的特徴に比べて、データの経済学の特徴はずっと複雑である。
データは価値を生むことができます。したがって、資産の属性があります。
データは商品とサービスの特徴を兼ね備えています。
一方、データは保存、転送可能であり、類似商品である。
データは蓄積できます。物理的にはクリッピングや腐敗はしません。
一方、多くのデータは形のない、似たようなサービスです。
データは資産として多くの特殊性を持っています。表1の視点から分析できます。表1:公共製品、準公共製品と個人製品の分類非競争性とは、一人である製品を消費する場合、他の人の消費を減少または制限しないことです。
言い換えれば、この製品は消費者を増やすごとに、限界コストは0に等しいです。
大部分のデータは繰り返し使用されてもよく、繰り返し使用するとデータの品質や容量が低下しません。また、同じ時間に他の人に使用されてもいいので、非競争性があります。
排他的でないということは、誰かがある商品を有料で消費する場合、他の有料の人がこの製品を消費するか、それとも排除するコストが高いということです。
多くのデータは排他的ではなく、たとえば天気予報のデータです。
技術と制度の設計を通して、一部のタイプのデータは排他性があります。
例えば、一部のメディア情報端末は有料で、有料会員だけが読むことができます。
表1によると、多くのデータは公共製品に属しており、いかなる目的でも自由に利用できます。
例えば、政府が発表した経済統計データと天気予報データ
いくつかのデータはクラブ製品で、準公共製品に属しています。例えば、前述の有料メディア情報端末です。
大部分のデータは非競争的なので、個人の製品と公共の資源に属するデータは少ないです。
データの所有権は法律でも実践でも複雑な問題です。特に個人データに対して
データは合理的に授権されていない場合に収集、保存、複製、伝播、集約と加工されやすく、そしてデータの集約と加工は新しいデータの発生に伴っている。
これはデータの所有権を明確に定義するのが難しく、効果的に保護されにくい。
例えば、インターネット経済において、インターネットプラットフォームにユーザーのクリック、閲覧、ショッピングの歴史などを記録することは、非常に価値のあるデータである。
これらのデータは、ユーザの特徴と行為を説明しているが、ユーザの個人情報のようにユーザによって外部に提供されるものではなく、ユーザによって所有されることは難しい。
インターネットプラットフォームはこれらのデータを記録して保存していますが、これらのデータはユーザーのプライバシーと利益と密接に関係しています。インターネットプラットフォームがユーザーの知らないところでこれらのデータを使用して処理するのは難しいです。したがって、インターネットプラットフォームも完全な財産権を持っていません。
そのため、制度設計や暗号学技術などを通じて、ユーザーをデータ主体及びインターネットプラットフォームとしてデータ制御者としての権利を精巧に定義する必要があり、これは彼らの間の経済的利益関係に著しい影響を与えます。
多くの文章はデータを新経済の石油にたとえている。
この比喩は実際には正確でない。
石油は競争性と排他性であり、財産権は明確に定義され、個人製品として現物と先物などの複雑な市場取引モデルを形成している。
多くのデータは所有権を明確に定義することが困難であり、公共製品または準公共製品として有効に市場取引に参加することは困難である。
だから、データを太陽の光にたとえたほうがいいです。
二、データ価値の内包と計量(一)データ価値の内包はDIKWモデルに基づいて、データから情報、知識と知恵を抽出します。これはデータ価値チェーンの概念を含みます。
元のデータは処理され、他のデータと統合された後、分析されて行動可能な見識が形成され、最終的に行動によって価値が生じる。
データの価値はミクロとマクロの二つの面から理解できる。
ミクロレベルでは、情報、知識、知恵は利用者の好奇心を満足させることができ、利用者の認知を高め、より良い方策を立てることができます。最終的な効果は彼らの効果を高めることです。
データのユーザーに対する効用の向上は、データの価値を反映している。
マクロの方面で、情報、知識と知恵は全体の要素の生産性を高めることに役立って、乗数の作用を発揮して、これもデータの価値の体現です。
本論文では主にミクロレベルのデータ価値について議論し、次のような重要な特徴がある。
1.同じデータが異なる人の価値に対して大きく異なることができます。同じデータから抽出した情報、知識と知恵はかなり違っています。
例えば、科学史において、多くの科学者が大衆の慣れっことした現象を深く研究し、重大な発見をしました。
重いものがニュートンに着地したのと、フランクリンに電撃したのとでは、海水の青いのはラマンで、それらの大衆に対する価値は全く違っています。
また、経済学では、異なる経済学者が同じ経済データに対して、しばしば全く異なる解釈をする。
第二に、他の人が置かれているシーンと直面している問題は違っています。同じデータが彼らに与える役割も違います。
同じデータは、一部の人にはごみかもしれません。他の人には宝物かもしれません。
例えば、考古学で発見された歴史研究者の価値は大きいが、金融投資家には価値がないかもしれない。
例えば、別種のデータ(Alteat ive Data)は、個人のデータ、ビジネスプロセスデータ、センサデータなどを含む。
これらのデータは投資家に投資の意思決定を助けることができますが、非金融投資家にはあまり価値がありません。
異なった人は異なる時間次元でデータを使うことができます。例えば、過去を評価するもの、現在を分析するもの、未来を予測するもの、遡及テストをするものもあります。
使用目的が違って、データに対する要求が違っています。同じデータは異なる価値を意味します。
第三に、制度や政策の枠組みによって、データの使用制限が異なり、データの価値にも影響します。
言い換えれば、データの価値の中で制度と政策に生まれます。
例えば、国によって個人データの保護度が異なり、個人データが収集され使用される場合とその価値は国の間で大きく異なる。
中国のランキング上位のインターネットプラットフォームはユーザーの行動データに基づいてオンライン信用商品を発表しました。これは他の国ではあまり見られません。
インターネットプラットフォームはユーザーデータを取得した後、適切に保護して使用しないと、ユーザーのプライバシーを尊重しなくなり、ブランドイメージとユーザーの信頼に影響を与え、データ価値と会社価値にもマイナス影響を与えます。
2020年4月、米連邦裁判所はFacebookと米連邦貿易委員会がケンブリッジのスキャンダル分析に関する50億ドルの和解協議を承認した。
2.データ価値は時間とともに変化します。第一に、データには時効性があります。
多くのデータは時間が経つと、観察対象の現在の状況をうまく反映できなくなりますので、価値が下がります。
この現象をデータ減価償却といいます。
データ減価償却は金融市場で非常にはっきりしています。
例えば、新しいニュースは発行されたばかりの時に証券価格に大きな影響を与えることができますが、証券価格がこのニュースを反映すると、金融投資の価値が急激に0に下がります。
DIKWモデルでは、データを情報、知識、知恵として精錬し、レベルを高くすればするほど、データ減価償却に抵抗することができます。
第二に、データにはオプション価値がある。
新しい機会と新しい技術は既存のデータに新しい価値を生むことができます。
多くの場合、データを集めるのは今の需要だけではなく、将来の福祉を高めるためにもなります。
3.データは外部性第一、データは個人の価値を個人価値と呼び、データは社会的価値を公共価値と呼びます。
データが排他的でない、または非競争的であると、外部性が発生し、個人価値と公共価値の差が生じる。
このような外部性はプラスマイナスであり,定説がない。
第二に、データとデータの結合の価値は、それぞれの値の和とは異なることができ、別の外部性である。
しかし、データの集約が価値を増すかどうかは、定説ではない。
一方、より多くのデータがよりよく暗黙的な法則と傾向を明らかにするような規模の報酬が増加することがあります。
一方、より多くのデータがより多くのノイズを導入するなど、規模報酬の減少が存在する可能性がある。
しかし、全体としては、データ容量が大きいほど、データの価値が高いとは限らず、データの内容も重要です。
例えば、1時間の映像監視データは、価値があるデータは1-2秒しかないかもしれません。
(二)データ価値の計量1.絶対推定値はデータ価値の三つの重要な特徴にかんがみて、データの絶対推定値は比較的に難しく、公認方法がない
現在の業界実践にはいくつかの主要な方法がありますが、いずれも欠陥があります。(BIPP、2020;徳勤と阿里研究院、2019)
第一に、コスト法、つまりデータの収集、保存、分析のコストをデータの評価基準とします。
これらのコストはソフトウェアとハードウェアの面があり、知的財産権と人的資源の面もあります。安全事件、敏感情報の紛失や名誉損失によるものやコストがあります。
データ収集と分析は、一般的に高い固定コスト、低限界コストの特徴があり、規模効果がある。
コスト法は簡単に実施できますが、同じデータが人に対して、異なる時点及び他のデータと組み合わせた時の価値の違いを考慮するのは難しいです。
また、徳勤とアリ研究院(2019)は、一部のデータは企業の生産経営に付加された製品であり、取得コストは通常業務から切り離せず、信頼性の高い測定が困難であると指摘しています。
明らかに、データの価値は必ずしもコストより高くないです。すべてのデータが収集、記憶、分析に値するというわけではないです。
第二に、収入法、つまりデータの社会的および経済的影響を評価し、これによって生じる将来のキャッシュフローを予測し、将来のキャッシュフローを現在のキャッシュフローに換算することである。
収入法は論理的に会社の評価値の中の現金換算法と似ています。データ価値の三つの重要な特徴を考慮できます。理論的には完璧ですが、実施中は多くの障害に直面しています。
一つはデータの社会と経済に対する影響モデル化の難しさが大きいです。
第二に、データのオプション値はどのように評価されますか?
現物オプション評価法はオプションですが、完璧ではありません。
第三に、市場法、つまりデータの市場価格を基準に、市場上にないデータの価値を評価する。
市場法は株式市場の株式益率と市場純率の評価方法に類似しています。
市場法の不足は、多くのデータが排他的または非競争的で、市場取引に参加するのが難しいことにある。
現在、データ要素市場にはいくつかの試みがありますが、市場の厚みと流動性が足りないため、価格発見機能が不健全です。
また、一部の会社はデータの見積もりを兼ねて買い付けていますが、なかなか分離できません。
第四に、アンケート試験法
この方法は主に個人データに対して、アンケートを通じて個人がどれぐらいのお金を払って自分のデータを譲ってくれるかをテストします。或いはいくらを使って自分のデータを保護したいですか?個人データの価値を評価します。
この方法の応用面は非常に狭く,実施コストが高い。
2.相対推定値データの相対推定値の目標は、データのセットと共通のタスクを与え、各データのセットごとに当該タスクを完了するための貢献を評価することである。
絶対推定値と比較して、相対推定値は簡単で、特に定量的データ分析タスクに対して
データの相対推定値において、共通のデータパケット方法は、1つは変数フィールドと同じであるが、異なる観察サンプルに属し、2つは同じ観察サンプルであるが、変数フィールドは異なる。
一般的な予測タスクと記述的なタスクに対して統計学とデータ科学は量子化評価指標を確立した。
例えば、予測タスクに対しては、サンプル外検査を行い、予測誤差を評価します。
予測変数が離散型の場合、通常の精度、エラー率、操作特徴(Receive Opeatig Chacteistic、ROC)曲線の下の面積などの指標が用いられます。
予測変数が連続型の場合、標準誤差がよく使われます。
記述タスクについては,サンプルデータを用いてモデルフィッティング効果を評価する必要があり,線形モデルは一般的にR平方を用い,非線形モデルは一般的に尤度関数を用いている(干渉項分布を仮定する必要がある)。
Shappley値を用いたデータの相対推定値は以下の手順に従う。
第一歩:データセットとその要素を定義する
第二ステップ:完成予定のタスクを定義する
第三ステップ:タスクを完了するために使用するモデルと評価指標を選択します。
第四のステップ:データセットの要素によって形成された各データセット(〡N〡)要素に対して、モデルを実行し、評価結果を得ることを意味する。
ステップ5:Shappley値に基づいて、各要素の任務遂行への貢献を計算する。
この方法の主な不足は、データセットの要素数が上がるにつれて、計算量が指数関数的に上昇することです。
主な長所は直感に合っていて、計算しやすいです。そして経済学の長期的な研究から生まれました。
Jia et al.(2019)Shappley値を用いたデータの相対推定値の計算過程の最適化について議論した。
データの相対推定値は、同じデータが異なるタスクに使用される場合、異なる分析方法を使用する場合、または異なるデータと組み合わせる場合、反映される価値は異なると説明しています。
特に、データセット「主流」から逸脱したデータは、比較的推定値では、データセット「主流」に近いデータよりも高い可能性があり、これは「異常値」(Outlie)の値を示している。
三、データ要素の構成メカニズムは現実において、データには様々な種類と特徴があり、それに応じて異なる構成メカニズムが生まれた。
多くのデータが市場取引に参加するのに適していないため、多くの配置機構は市場取引モードに属していません。
言い換えれば、市場化の配置は市場取引モードとは等しくない。
これらのメカニズムはいずれもデータ要素配置における二つの顕著な問題の解決に取り組んでいる。
第一に、情報非対称性
データ要素の配置メカニズムは、複数の利益の不一致の参加者に関する。
例えば、データの本体はよく自分のデータがいつ、何の目的や結果があるか分かりません。収集されます。
データ生産者は、データ本体が選択的にデータを開示しているかどうか、また、自分のデータが収集されていることを知っている時に、ターゲットに合わせて調整されているかどうか、また、生産されたデータが異なるデータ使用者に対する価値が分かりません。
データ利用者は事前にデータの価値を十分に把握するのが難しいです。
例えば、データの相対評価は後から行うものです。
第二、非完全契約
データ要素配置メカニズムは、一連の契約の組み合わせとして表示されます。
しかし、データ応用には豊富なシーンがあり、データ価値チェーンにはいくつかの環節があり、データ価値には客観的な計量基準が欠けています。これらの要素はデータ要素の配置メカニズムを事前にカバーした後、すべての可能性がある状況をもたらしにくいです。
これはデータ本体のデータ共有及びデータ生産者の生産データの激励に影響するだけでなく、データ価値チェーンにおける異なる貢献者間の合理的な配分にも影響する。
次に、データの経済学的特徴及び応用シーンに基づいて、代表的なデータ要素配置メカニズムについて議論する。
(一)公共製品のデータとして公共製品とする場合、個人部門が提供する投資不足と供給不足の問題があり、政府部門が税収収入を利用して提供する
政府部門のデータ開放と共有プロジェクトはこの枠組みの中で理解できます。
政府部門は機密に関わらない前提の下で、できるだけ社会と市場に政府のデータを開放してこそ、政府のデータの公共価値を最大化することができる。
2009年には、連邦政府がデータを公開し、ポータルサイトをオープンしました。Data.govは、以前は、連邦政府のさまざまな機関のウェブサイトに分散されていたデータのために、統一的に管理プラットフォームを提供します。
2019年、米国の「オープン政府データ法案」は、国家の安全とその他の特殊な原因に関わるデータ以外に、連邦政府がオンラインでそれらの保有するデータを公開し、これらの公開データは標準化、機械読み取り可能な形式をとるべきだと要求しています。
2016年以来、我が国は「政務情報資源共有管理暫定弁法」、「公共情報資源開放試行業務方案」など一連の文書を公布し、政務データ共有開放プロセスを開始した。
「より完全な要素の市場化配置体制の構築に関する意見」が提出した最初の仕事の方向は、政府のデータ開放共有を推進することである。
(二)準公共産品のデータとして準公共産品のデータが所有権において比較的はっきりしていて、かつ排他的である場合、以下の3つの主要な構成機構がある。
第一に、クラブ製品のデータとして、有料メディア情報端末などの有料注文モードがあります。
第二に、オープン銀行モード
銀行は、アプリケーションインターフェースを通じて、ユーザーデータの開発と使用を促進するために、認証された第三者機関にユーザーデータを開放します。
銀行はどれらのユーザーデータを限定して開放することができますか?
これは実際には、部分的にユーザデータを実現するための携帯可能性である。
第三に、データ信頼モード
BIPP(2020)の紹介によると、データ信頼は法律信頼、契約、会社及び公共とコミュニティ信頼などの異なる形をとることができる。
データ信頼の主な目標は、一つはデータを共有できるようにすること、二つは公共利益及びデータ共有者の個人利益を促進すること、三つはデータに対して法律権利がある人の利益を尊重すること、四つはデータを倫理とデータ信頼ルールに合うように共有すること。
(三)インターネットプラットフォームのPIK(Pay-i-kid)モードは前に述べたように、インターネット経済において、個人データがユーザーから外部に提供されるのではなく、インターネットプラットフォームからユーザーの特徴と行為に対する観察と記録である場合、所有権は明確に定義されにくい。
現実的には、インターネットプラットフォームは常にユーザーに無料の情報と社交サービスを提供しています。目的はユーザーの量を拡大し、ユーザーの関心と個人データ(例えば、ユーザーの好み、消費特徴、社会的な連絡など)を獲得することです。
このモードでは、ユーザが自分の関心と個人データを情報とソーシャルサービスと交換すると考えられ、PIKモードと呼ばれる(図2)。
インターネットプラットフォームは広告収入によってユーザーの流量を変化させる一方、ユーザーの個人データに基づいて精確なマーケティングと信用商品の開発などを行う。
2通目:遊女・平原・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・)
第二に、インターネットプラットフォームがキャプチャー生態を形成すると、ユーザーをロックし、実際にユーザーデータを制御する。
ユーザーは自分のデータをインターネットのプラットフォームの競争相手に開放または移転するのが難しいです。
インターネットプラットフォームはデータ独占を通じてPIKモードでデータ制御者(インターネットプラットフォーム)がデータ本体(ユーザー)に対して主導的な地位を占めており、データ制御者もデータ利用者であり、データ本体は自分のデータに対してコントロールが不足しており、データ所有権には多くのあいまいさがある。
PIKモードの弊害をどう修正するかは、個人データ管理の中の核心問題です。
(四)データ要素市場の多くのデータは排他的でないか、または非競争的なため、市場取引に参加することが制限されている
一方、排他的でない、または非競争的にもたらされる外部性は、データの個人価値と公共価値の間に差異があり、市場取引が必ずしもデータの最大社会価値を実現するとは限らない。
現実的には、データの種類と特徴の多様性、およびデータの価値は客観的な計量基準に欠けているため、現在は集中化、流動性の良いデータ要素市場が存在しない。
しかし、データのポイント取引(場外取引のような)はずっと発生しています。
この市場には多くの他のデータプロバイダが存在します。
それらのデータに対する処理の程度は浅いから深いまで、大体元のデータプロバイダ、軽処理データプロバイダと信号提供者に分けられます。
この市場はすでにコンサルティング仲介、データ集約業者、技術サポート仲介などに発展しており、データ買い手(主に投資ファンド)とデータ提供者の間の橋渡しとして利用されています。
この中で、コンサルティング仲介は買い手に対して、別種のデータの購入、処理及び関連法律に関するコンサルティングを提供します。
データ集約業者は統合サービスを提供しています。買い手はそれらと協議すればよく、市場に入る必要がなく、分散したデータプロバイダと付き合う必要がありません。
技術サポート仲介はバイヤーに技術コンサルティングを提供し、データベースとモデリングなどを含みます。
これによりますと、別種のデータ市場の発展はすでに完全で、豊富な分業協力関係を形成していますが、この市場は依然として不透明で非標準化されています。
これは現在のデータ取引で直面している普遍的な問題です。
さらに無視できないのは、プライバシーデータを取引する「データブラック」や「データブラック」などの不正なデータ取引です。
2019年以来、我が国は「データ黒産」に対して集中的な整備を行ってきました。
コンプライアンスの効果的なデータ要素市場はどうやって作りますか?一つの実行可能なオプションは、暗号化技術を使用して、検証可能計算(Vefiable computtig)、同形暗号化(Homophic ecypetio)、および安全マルチ演算(Secue multi-patycomputation)など(Platon,2018)を含む。
複雑な計算タスクに対して、検証可能な計算は簡単な証明を生成します。
この短い証明を検証すれば、計算タスクが正確に実行されているかどうかを判断できます。計算タスクを繰り返す必要はありません。
同形暗号化と安全多面計算の下で、対外的にデータを提供する時、平文形式ではなく暗号文をとって、データに排他性を持たせる。
これらの暗号学技術は、データの所有権に影響を及ぼさない前提で取引データの使用権を可能にし、データ取引の財産権基礎を構築し、データ本体とデータ制御者の経済的利益関係に影響を与える。
ブロックチェーン技術はデータ保存証と使用授権に用いられ、またデータ財産権の定義においても重要な役割を果たします。
技術以外に、データ財産権の定義も制度設計によって実施できます。
それでも、暗号学に基づくデータ要素市場は伝統市場とは違っています。
まず、同じデータは暗号化された後に同時に多方面に提供されますので、まだ非競争的です。データ利用者とデータ制御者の間で秘密保持契約が締結されていない限り、後者は他の人にデータを提供してはいけないと要求されます。またはデータには強力な時効性があります。使用後すぐに価値がなくなります。
つまり、データは個人の商品になりにくいので、個人の商品のように市場取引に参加するのは難しいです。
第二に、同じデータでも人に対する価値はかなり違っています。
これは、暗号学に基づくデータ使用権取引において、データ価値に対するアプリケーションシーンの影響が、データ自体の特徴や内容の影響を超えている可能性があり、データ取引価格から価値のある価格設定情報を抽出するのが難しい。
したがって、暗号学に基づくデータ要素市場では、「同一商品、複数の買い手に対して価格、価格が高い者が得られる」という要素配置パターンは採用されません。
説明が必要なのは、データ要素市場は必ずしも簡単な仲介取引モデルではなく、他の複雑なモデルが存在することができるということです。
例えば、Makit公司(2016年HISと合併してHIS Makit)はCDS(Cent Default Swap、信用違約スワップ)を創立して、定価データサービスのモデルを研究する価値があります。
国際金融危機前、CDSは純粋な場外取引で、情報開示が不十分だった。
CDSのポジションは金融機関の重要な商業機密であり、他の金融機関と共有するのは難しい。
CDS市場に参与する金融機関は自分のCDSのポジションしか知らないですが、市場全体の状況は分かりません。
CDS市場には良い指数がなく、情報の非対称性が高い。
Makitは2003年に設立されました。その株主は主要なCDSを含みます。
これらの金融機関の株主は自分のCDSデータをMakitにアップロードし、MakitはCDS市場のデータを統合した後、有料で外部に提供します。定価と参考データ、指数製品、評価値と取引サービスなどを含みます。
Makitの株主金融機関は、自分のビジネス秘密を漏らさないまま、Makitの仕事からCDS市場全体の状況を知るだけでなく、Makitの事業成長から投資収益を得ることができます。
Makitはデータを明示的に定価していないが、株式の利益結合機能とデータ統合の「1+1」2効果により、データ共有におけるインセンティブ適合問題を解決した。
これは複雑で巧妙なデータ取引モデルです。
中国の個人信用市場の百行信用会社も似たような枠組みの下で理解できます。
(五)データ財産権の定義は前に紹介したデータ要素の配置メカニズムから分かるように、データ財産権の定義はデータ要素の有効配置の基礎である。
データ所有権は主に所有権と支配権に分けられます。
データ制御権は、誰がデータを使うことができますか?データをどう使うか、さらにデータを共有することができますか?
会社の管理において、所有権と支配権は統一されています。株主は会社を持ち、株主総会は会社の最高権力機関です。
しかし、データの所有権と支配権は分離できます。特に所有権が不明な個人データは
データ財産権は技術によって規定されてもいいです。例えば、検証計算、同形暗号化、安全多面計算などの暗号学技術です。
データの財産権は制度設計によって規定されます。
2018年5月、EUは「共通データ保護条例」(GDPR)の実施を開始した。
GDPRはデータ本体に広範な権力を与えます。第一に、忘れ権とは、データ本体がデータ制御者に個人データの削除を要求する権利を有し、個人データの伝播を避けるためです。
第二に、携帯可能権とは、データ本体が本人データをデータ制御者に要求し、用途を自主的に決定する権利をいう。
第三に、データ主体は、自主的、特定の目的に基づいて、かつデータ制御者との地位バランスなどの状況下で、データ制御者に個人データを処理するように授権されたが、授権は法律上永久的な効力を持たず、いつでも取り下げることができる。
第四に、特別な種類の個人データの処理条件、例えば医療データ
GDPRはまたデータ制御者に対する要求を高めました。第一に、企業はデータ制御者として事前データ収集と事後データ漏洩の二つの段階で明確な告知義務を履行しなければなりません。
第二に、データ収集とデータ使用目標の一対一の対応原則及びデータ収集(範囲、数量、時間、接触主体など)の最小化原則
第三に、個人データトランジット条件
全体として、GDPRは、忘れ権、携帯可能権、条件付き授権、採集原則の最小化など、データ管理のシステムモデルを構築するために、データ財産権の厳密な次元を導入している。
これらのやり方は欧州連合以外の多くの国と地域に受け入れられています。
2019年5月、中国網信弁弁は「データ安全管理弁法(意見募集稿)」を発表しました。
2019年12月、国家ネット信用弁公、工信部、公安部と市場監督管理総局の四部門は共同で「App違法違法違法収集利用個人情報行為認定方法」を印刷して発行した。
個人データ管理の核心問題プライバシー保護
プライバシーは個人と他人、私有と公開の境界を含み、個人の尊厳、自主と自由の重要な側面である(Acquisti et al.2016)
プライバシーは個人情報の共有を排除するのではなく、共有プロセスを効果的に制御し、個人データの保護と共有の間でバランスをとってください。
個人データに対して、支配権とプライバシー保護の重要性は所有権を超えます。
この点はGDPRに反映されている。
四、まとめ本文はデータ要素の特徴、価値と配置メカニズムについて初歩的な研究を行いました。主な結論は以下の通りです。
データは情報科学の中の基本的で複雑な概念として、情報や知識などの関連概念の分析から切り離せないほど理解されています。DIKWモデルはこれに対して適切な分析フレームワークを提供しています。
DIKWモデルによると、知恵、知識、情報とデータの間に、狭い口径から広い口径までの従属関係が順次存在します。
データは観察の産物です。
データは認知プロセスを経て情報を得て、誰(Who)、何(What)、どこ(Whee)、いつ(Whe)などの問題に関する答えを与えます。
知識はデータと情報の応用で、どうやって作るかについての答えを出します。
知恵は鮮明な価値判断の意味があり、多くの場合、未来の予測と価値観に関係があります。
データには複数の次元の技術的特徴がありますが、データの経済学的特徴はもっと複雑です。
データは価値を生むことができますので、資産の属性があります。
データは商品とサービスの特徴を兼ね備えています。
多くのデータは公共製品に属しています。いかなる目的でも自由に使ったり、改造したり、共有したりできます。
ほとんどのデータは非競争的なので、個人の製品や公共資源に属するデータが少ないです。
データの所有権は法律でも実践でも複雑な問題です。特に個人データに対して
データを石油にたとえるなら、データを太陽の光にたとえるほうがいい。
データは処理され、他のデータと統合された後、分析されて行動可能な見識が形成され、最終的に行動によって価値が生じる。
データの価値は微視的な面で使用者に対する効用の向上として現れています。マクロ面ではデータから抽出された情報、知識、知恵の全要素生産性の向上に現れています。
しかし、データの価値は客観的な計量基準に欠けています。主に3つの原因があります。1つは同じデータが異なる人の価値に対して大きく異なることができます。2つはデータの価値は時間とともに変化します。3つはデータが外部性を生むことです。
データ値の測定は絶対推定値と相対推定値を含む。
データの絶対評価は難しいです。公認方法がありません。
現在の業界は主にコスト法、収入法、市場法とアンケートテスト法を使っていますが、いずれも欠陥があります。
データの相対推定値は、与えられたデータのセットと共通のタスクであり、各データのタスクの完了に対する貢献を評価する。
絶対的な推定値に比べて、相対的な推定値は簡単です。
定量的なデータ分析タスクに対して、Shappley値を使って相対的に評価することができます。
データには様々な種類と特徴があり、異なる構成機構が発生しています。
これらの配置メカニズムはデータ要素の配置における情報非対称性と非完全契約問題に取り組んでいる。
本論文では主に4つの構成機構を論じた。
第一に、公共製品のデータとして、政府部門が税収収入を利用して提供します。
政府部門は機密に関わらない前提の下で、できるだけ社会と市場に政府のデータを開放してこそ、政府のデータの公共価値を最大化することができる。
第二に、準公共製品のデータとしては、所有権が明確で、排他的であれば、クラブ製品式の有料モデル、オープン銀行モード及びデータ信託モードを採用することができる。
第三に、インターネット経済において、多くの個人データの所有権を明確に定義するのは難しいです。現実によくあるPIK(Pay-i-kid)モードは、本質的にはユーザーが自分の注意力と個人データを使って情報と社交サービスを交換するのですが、PIKモードには多くの弊害があります。
第四に、多くのデータは排他的または非競争的なため、市場取引に参加するのに適していません。
言い換えれば、市場化の配置は市場取引モードとは等しくない。
集中化、流動性の高いデータ要素市場は現実には存在しない。
データのポイント取引(場外取引のようなもの)が発生していますが、不透明で非標準化されており、不正データ取引は無視できない問題です。
データ財産権の定義はデータ要素の有効配置の基礎である。
データの所有権に影響を与えない前提で取引データの使用権を可能にし、データ取引の財産権の基礎を構築する。
ブロックチェーン技術はデータ保存証と使用授権に用いられ、またデータ財産権の定義においても重要な役割を果たします。
それでも、暗号学に基づくデータ要素市場は伝統市場と違って、「同じ商品、複数の買い手に対して価格を競って、高い者が得る」という要素の配置パターンは採れない。
技術以外に、データの財産権は制度設計によって規定されます。
GDPRは、忘れ権、持ち運び可能権、条件付き授権、採集原則の最小化などを含め、データ管理のシステムモデルを構築した。
これらのやり方は欧州連合以外の多くの国と地域に受け入れられています。
個人データ管理の核心問題プライバシー保護
個人データに対して、支配権とプライバシー保護の重要性は所有権を超えます。
参考文献1、Ackoff、R.L.1989、「Fom Data to Wisdom」、Joual of Aplied System Aalysis、16:3-9.2、Acquisti、A.C.Tayloo、ad L.Wagma、2016、「The Ecoomics of Pivacy」、Jouual of of Ebletatoblic、2010 2010 2010 2010-444 4-Epfofofofofofofofofofofofofottttttttttblic、The 4、2010 2010-4 4、The e 2.Epufofofofofofofofofofofofofofofofofofofofofofofofofofofofofofofofonic.https:wwww.beettistitute.ac.kseach-poject svalug-data 4Jia R.D.Dao,B.Wag,F.Hubis,N.Hyes,N.Guil,B.Li,C.Zhag,D.Sog,ad C.Spaos,2019,「Towands Efficiet Data Vffeatio Based the Shappley Value」.5,Plation,Netcity,2018https:www.plot.etwokstaticpdfeplaton_A%20 High-Efficiecy%20 Tustless%20 Computtig%20 Netwok_Whitoepapple_EN.pdf 6Rowley,J.2007,「The Wisdom Heachy:Repesetatio of the DIKW Heachy」,Joual of Ifomatio ad Commication Scice,33(2):163-180.7、デロイトとアリ研究院、2019、「データ資産化の道——データ資産の推計値と業界実践」8、李小加、2020、「データ要素産業化連盟の成立を呼びかける」、香港取引所9、施洋、王建冬、郭巧敏、2020、「中国がデータ新型要素市場体系を構築するために直面する挑戦と対策」、「電子政務」2020年第3期